5.2 Suavizado de series temporales El suavizado se suele hacer para ayudarnos a ver mejor patrones, tendencias por ejemplo, en series de tiempo. Por lo general suavizar la irregularidad irregular para ver una señal más clara. Para los datos estacionales, podemos suavizar la estacionalidad para que podamos identificar la tendencia. Smoothing no nos proporciona un modelo, pero puede ser un buen primer paso para describir varios componentes de la serie. A veces se utiliza el término filtro para describir un procedimiento de suavizado. Por ejemplo, si el valor suavizado para un tiempo determinado se calcula como una combinación lineal de observaciones para tiempos circundantes, podría decirse que hemos aplicado un filtro lineal a los datos (no es lo mismo que decir que el resultado es una línea recta, por la manera). El uso tradicional del término media móvil es que en cada punto en el tiempo determinamos (posiblemente ponderado) promedios de los valores observados que rodean un tiempo particular. Por ejemplo, en el tiempo t. Un promedio móvil centrado de la longitud 3 con pesos iguales sería el promedio de los valores a veces t -1. T Y t1. Para quitar la estacionalidad de una serie, para que podamos ver mejor la tendencia, usaríamos un promedio móvil con un lapso de duración de temporada. Así, en la serie suavizada, cada valor suavizado se ha promediado en todas las estaciones. Esto puede hacerse mirando un promedio móvil unilateral en el cual usted promedio todos los valores para los años anteriores vale la pena de datos o una media móvil centrada en la que se utilizan valores antes y después de la hora actual. Para los datos trimestrales, por ejemplo, podríamos definir un valor suavizado para el tiempo t como (x t x t-1 x t-2 x t-3) / 4, el promedio de este tiempo y los 3 trimestres anteriores. En el código R, este será un filtro unilateral. Un promedio móvil centrado crea un poco de una dificultad cuando tenemos un número par de períodos de tiempo en el período de temporada (como solemos hacer). Para suavizar la estacionalidad en los datos trimestrales. Con el fin de identificar la tendencia, la convención habitual es utilizar el promedio móvil suavizado en el momento t es suavizar la estacionalidad en los datos mensuales. Es decir, se aplica el peso 1/24 a los valores a veces t6 y t6 y el peso 1/12 a todos los valores en todo momento entre t5 y T5. En el comando Filtro R, especifique bien un filtro de dos caras cuando desee utilizar valores que vienen tanto antes como después del tiempo para el cual fueron suavizados. Tenga en cuenta que en la página 71 de nuestro libro, los autores aplican pesos iguales a través de una media móvil estacional centrada. Eso está bien también. Por ejemplo, un tono trimestral más suave puede ser suavizado en el momento t es fraccionado x frac x frac x frac x frac x Un mensual más suave podría aplicar un peso de 1/13 a todos los valores de los tiempos t-6 a t6. El código que utilizan los autores en la página 72 se aprovecha de un comando rep que repite un valor un cierto número de veces. No utilizan el parámetro filter dentro del comando filter. Ejemplo 1 Producción trimestral de cerveza en Australia Tanto en la lección 1 como en la lección 4, examinamos una serie de producción trimestral de cerveza en Australia. El siguiente código R crea una serie suavizada que nos permite ver el patrón de tendencia y traza este patrón de tendencia en el mismo gráfico que la serie temporal. El segundo comando crea y almacena la serie suavizada en el objeto denominado trendpattern. Tenga en cuenta que dentro del comando filter, el parámetro named filter da los coeficientes para nuestro suavizado y sides 2 hace que se calcule un liso centrado. Beerprod (beerprod. dat) filtro de tendencia (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) parcela (beerprod, tipo b, ) Lines (trendpattern) Heres el resultado: Podemos restar el patrón de tendencia de los valores de datos para obtener una mejor mirada a la estacionalidad. El resultado sigue: Otra posibilidad para suavizar la serie para ver la tendencia es el filtro unilateral del filtro trendpattern2 (beerprod, filter c (1/4, 1/4, 1/4, 1/4), sides1) Con esto, el valor suavizado es el promedio del año pasado. \ Vskip1.000000 \ baselineskip Ejemplo 2 Desempleo Mensual de los Estados Unidos En la tarea de la semana 4 se examinó una serie mensual de desempleo estadounidense para 1948-1978. Heres un alisamiento hecho para mirar la tendencia. Trendunemployfilter (desempleo, filtroc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy ts (trendunemploy, start c (1948,1), freq 12) parcela (trendunemploy, mainTrend en US Desempleo, 1948-1978, xlab Año) Sólo se traza la tendencia suavizada. El segundo comando identifica las características de tiempo calendario de la serie. Eso hace que la trama tenga un eje más significativo. La trama sigue. Para las series no-estacionales, usted no está obligado a suavizar sobre cualquier período particular. Para suavizar, debe experimentar con medias móviles de diferentes tramos. Esos períodos de tiempo podrían ser relativamente cortos. El objetivo es eliminar los bordes ásperos para ver qué tendencia o patrón puede estar allí. Otros métodos de suavizado (Sección 2.4) La Sección 2.4 describe varias alternativas sofisticadas y útiles para el suavizado promedio móvil. Los detalles pueden parecer incompletos, pero eso está bien porque no queremos quedar atascados en un montón de detalles para esos métodos. De los métodos alternativos descritos en la Sección 2.4, el lowess (regresión localmente ponderada) puede ser el más utilizado. Ejemplo 2 Continúa La siguiente gráfica es una línea de tendencia suavizada para la serie de desempleo de los Estados Unidos, encontrada usando un lowess más suave en el cual una cantidad sustancial (2/3) contribuyó a cada estimación suavizada. Tenga en cuenta que esto suavizado la serie más agresiva que el promedio móvil. Los comandos utilizados fueron los desempleados (desempleo, inicio c (1948,1), freq12) parcela (lowess (desempleo, f 2/3), suavizado principal Lowess de la Tendencia de Desempleo de los Estados Unidos) Suavizado Exponencial Único La ecuación básica de predicción para el suavizado exponencial simple Se pronostica que el valor de x en el tiempo t1 sea una combinación ponderada del valor observado en el tiempo t y el valor pronosticado en el tiempo t. Aunque el método se denomina método de suavizado, se utiliza principalmente para pronósticos a corto plazo. El valor de se llama constante de suavizado. Por cualquier razón, 0.2 es una popular opción por defecto de los programas. Esto pone un peso de 0,2 en la observación más reciente y un peso de 1,2,8 en la última previsión. Con un valor relativamente pequeño de, el alisado será relativamente más extenso. Con un valor relativamente grande de, el alisado es relativamente menos extenso ya que se pondrá más peso en el valor observado. Este es un simple método de previsión de un paso adelante que a primera vista parece no requerir un modelo para los datos. De hecho, este método es equivalente al uso de un modelo ARIMA (0,1,1) sin constante. El procedimiento óptimo consiste en ajustar un modelo ARIMA (0,1,1) al conjunto de datos observado y utilizar los resultados para determinar el valor de. Esto es óptimo en el sentido de crear lo mejor para los datos ya observados. Aunque el objetivo es suavizar y avanzar un paso adelante, la equivalencia con el modelo ARIMA (0,1,1) trae un buen punto. No debemos aplicar ciegamente el suavizado exponencial porque el proceso subyacente puede no estar bien modelado por un ARIMA (0,1,1). ARIMA (0,1,1) y Equivalencia exponencial de suavizado Consideremos un ARIMA (0,1,1) con media 0 para las primeras diferencias, xt - x t - 1: begin hat amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1que tienden. Si dejamos (1 1) y por lo tanto - (1) 1, vemos la equivalencia a la ecuación (1) anterior. Por qué se llama al método Suavizado exponencial Esto produce lo siguiente: comienza hat amplificador amp alfa xt (1-alfa) alfa x (1-alfa) hat amplificador alfa xt alfa (1-alfa) x (1-alfa) 2hat final Continuar De esta manera sustituyendo sucesivamente el valor previsto en el lado derecho de la ecuación. Esto conduce a: hat alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x dots alfa (1-alfa) jx puntos alfa (1-alfa) x1 texto La ecuación 2 muestra que el valor pronosticado es un promedio ponderado De todos los valores pasados de la serie, con pesos que cambian exponencialmente a medida que retrocedemos en la serie. Optimización del suavizado exponencial en R Básicamente, sólo ajustamos un ARIMA (0,1,1) a los datos y determinamos el coeficiente. Podemos examinar el ajuste del liso comparando los valores predichos con la serie real. El suavizado exponencial tiende a usarse más como una herramienta de pronóstico que como un verdadero más suave, por lo que buscamos ver si tenemos un buen ajuste. \ Vskip1.000000 \ baselineskip Ejemplo 3 N 100 observaciones mensuales del logaritmo de un índice de precios del petróleo en los Estados Unidos. La serie de datos es: Un ajuste de ARIMA (0,1,1) en R dio un coeficiente MA (1) 0,3877. Ası, (1 1) 1.3877 y 1- -0.3877. La ecuación de predicción de suavizado exponencial es hat 1.3877xt - 0.3877hat t En el tiempo 100, el valor observado de la serie es x 100 0.86601. El valor previsto para la serie en ese momento es Así, el pronóstico para el tiempo 101 es el sombrero 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A continuación se muestra qué tan bien el más suave se ajusta a la serie. Es un buen ajuste. Eso es una buena señal para la previsión, el principal objetivo de este suave. Aquí están los comandos usados para generar la salida para este ejemplo: oilindex scan (oildata. dat) trazado (oilindex, tipo b, registro principal de la serie de índices de aceite) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit Para ver los resultados del arima predichos oilindex - expsmoothfitresiduals predited values plot (oilindex, typeb, principal Alisamiento Exponencial de Log of Oil Index) líneas (predicteds) 1.3877oilindex100-0.3877predicteds100 pronóstico para el tiempo 101 Double Sponer Exponencial El doble suavizado exponencial podría ser utilizado cuando theres Tendencia (ya sea a largo plazo o corto plazo), pero sin estacionalidad. Esencialmente, el método crea un pronóstico combinando estimaciones exponencialmente suavizadas de la tendencia (pendiente de una recta) y el nivel (básicamente, la intersección de una recta). Dos pesos diferentes, o parámetros de suavizado, se utilizan para actualizar estos dos componentes en cada momento. El nivel suavizado es más o menos equivalente a un simple suavizado exponencial de los valores de los datos y la tendencia suavizada es más o menos equivalente a un simple suavizado exponencial de las primeras diferencias. El procedimiento es equivalente al montaje de un modelo ARIMA (0,2,2), sin constante puede realizarse con un ajuste ARIMA (0,2,2). (1 - B) 2 xt (1 theta1B theta2B2) wt. NavigationA series de tiempo es una secuencia de observaciones de una variable aleatoria periódica. Ejemplos de ello son la demanda mensual de un producto, la matrícula anual de primer año en un departamento de la universidad y los flujos diarios en un río. Las series temporales son importantes para la investigación operativa porque son a menudo los impulsores de los modelos de decisión. Un modelo de inventario requiere estimaciones de las demandas futuras, un modelo de programación y dotación de personal para un departamento universitario requiere estimaciones del flujo futuro de estudiantes y un modelo para proporcionar advertencias a la población en una cuenca requiere estimaciones de flujos fluviales para el futuro inmediato. El análisis de series temporales proporciona herramientas para seleccionar un modelo que describe las series temporales y utilizar el modelo para predecir eventos futuros. El modelado de la serie temporal es un problema estadístico porque los datos observados se utilizan en procedimientos computacionales para estimar los coeficientes de un supuesto modelo. Los modelos suponen que las observaciones varían aleatoriamente sobre un valor medio subyacente que es una función del tiempo. En estas páginas restringimos la atención a la utilización de datos históricos de series de tiempo para estimar un modelo dependiente del tiempo. Los métodos son apropiados para el pronóstico automático a corto plazo de la información de uso frecuente donde las causas subyacentes de la variación del tiempo no están cambiando marcadamente en el tiempo. En la práctica, los pronósticos derivados de estos métodos son posteriormente modificados por analistas humanos que incorporan información no disponible a partir de los datos históricos. Nuestro objetivo principal en esta sección es presentar las ecuaciones para los cuatro métodos de pronóstico utilizados en el complemento de predicción: promedio móvil, suavizado exponencial, regresión y suavizado exponencial doble. Estos son llamados métodos de suavizado. Los métodos no considerados incluyen la predicción cualitativa, regresión múltiple, y métodos autorregresivos (ARIMA). Los interesados en una cobertura más amplia deben visitar el sitio de principios de pronóstico o leer uno de los varios libros excelentes sobre el tema. Utilizamos el libro Previsión. Por Makridakis, Wheelwright y McGee, John Wiley amp Sons, 1983. Para utilizar el libro de Ejemplos de Excel, debe tener instalado el complemento de Pronóstico. Elija el comando Relink para establecer los vínculos al complemento. Esta página describe los modelos utilizados para la predicción simple y la notación utilizada para el análisis. Este método de pronóstico más simple es el pronóstico del promedio móvil. El método simplemente promedios de las últimas m observaciones. Es útil para series de tiempo con una media que cambia lentamente. Este método considera todo el pasado en su pronóstico, pero pesa la experiencia reciente más fuertemente que menos reciente. Los cálculos son simples porque sólo la estimación del período anterior y los datos actuales determinan la nueva estimación. El método es útil para series de tiempo con una media que cambia lentamente. El método del promedio móvil no responde bien a una serie cronológica que aumenta o disminuye con el tiempo. Aquí incluimos un término de tendencia lineal en el modelo. El método de regresión se aproxima al modelo mediante la construcción de una ecuación lineal que proporciona el ajuste por mínimos cuadrados a las últimas m observaciones. Datos suaves elimina la variación aleatoria y muestra las tendencias y los componentes cíclicos Inherente a la recolección de datos tomados en el tiempo es alguna forma de variación aleatoria. Existen métodos para reducir la cancelación del efecto debido a la variación aleatoria. Una técnica frecuentemente utilizada en la industria es suavizar. Esta técnica, cuando se aplica correctamente, revela más claramente la tendencia subyacente, los componentes estacionales y cíclicos. Existen dos grupos distintos de métodos de suavizado Métodos de promedio Métodos exponenciales de suavizado Tomar promedios es la forma más sencilla de suavizar los datos Primero investigaremos algunos métodos promediadores, como el promedio simple de todos los datos anteriores. Un gerente de un almacén quiere saber cuánto un proveedor típico ofrece en unidades de 1000 dólares. Se toma una muestra de 12 proveedores, al azar, obteniendo los siguientes resultados: La media o media calculada de los datos 10. El gestor decide usar esto como la estimación para el gasto de un proveedor típico. ¿Es esto una buena o mala estimación? El error cuadrático medio es una forma de juzgar qué tan bueno es un modelo Vamos a calcular el error cuadrático medio. La cantidad verdadera del error gastada menos la cantidad estimada. El error al cuadrado es el error anterior, al cuadrado. El SSE es la suma de los errores al cuadrado. El MSE es la media de los errores al cuadrado. Resultados de MSE por ejemplo Los resultados son: Errores y errores cuadrados La estimación 10 La pregunta surge: ¿podemos usar la media para pronosticar ingresos si sospechamos una tendencia? Un vistazo a la gráfica abajo muestra claramente que no debemos hacer esto. El promedio pesa todas las observaciones pasadas igualmente En resumen, declaramos que El promedio simple o la media de todas las observaciones pasadas es sólo una estimación útil para pronosticar cuando no hay tendencias. Si hay tendencias, utilice estimaciones diferentes que tengan en cuenta la tendencia. El promedio pesa todas las observaciones pasadas igualmente. Por ejemplo, el promedio de los valores 3, 4, 5 es 4. Sabemos, por supuesto, que un promedio se calcula sumando todos los valores y dividiendo la suma por el número de valores. Otra forma de calcular el promedio es añadiendo cada valor dividido por el número de valores, o 3/3 4/3 5/3 1 1.3333 1.6667 4. El multiplicador 1/3 se llama el peso. En general: barra frac fracción izquierda (frac derecha) x1 izquierda (frac derecha) x2,. ,, Izquierda (frac derecha) xn. El (izquierda (frac derecha)) son los pesos y, por supuesto, suman 1.
No comments:
Post a Comment