Tuesday 28 November 2017

B) Moving Average Models


Los procesos de error promedio móvil (errores ARMA) y otros modelos que implican retrasos de los términos de error pueden ser estimados usando sentencias FIT y simulados o pronosticados usando sentencias SOLVE. Los modelos ARMA para el proceso de error se usan con frecuencia para modelos con residuos autocorrelados. La macro AR se puede utilizar para especificar modelos con procesos de error autorregresivo. La macro MA se puede utilizar para especificar modelos con procesos de error de media móvil. Errores auto-regresivos Un modelo con errores autorregresivos de primer orden, AR (1), tiene la forma mientras que un proceso de error AR (2) tiene la forma y así sucesivamente para procesos de orden superior. Obsérvese que los s son independientes e idénticamente distribuidos y tienen un valor esperado de 0. Un ejemplo de un modelo con un componente AR (2) es y así sucesivamente para procesos de orden superior. Por ejemplo, puede escribir un modelo de regresión lineal simple con MA (2) errores de media móvil, donde MA1 y MA2 son los parámetros de media móvil. Tenga en cuenta que RESID. Y se define automáticamente por PROC MODEL como La función ZLAG debe utilizarse para que los modelos MA trunquen la recursión de los retrasos. Esto asegura que los errores rezagados empiezan a cero en la fase de cebado y no propagan los valores faltantes cuando faltan las variables del período de cebado y aseguran que los errores futuros son cero en lugar de faltar durante la simulación o la predicción. Para obtener más información sobre las funciones de retraso, consulte la sección Lag Logic. El modelo general ARMA (p, q) tiene la siguiente forma Un modelo ARMA (p, q) se puede especificar de la siguiente manera: donde AR i y MA j representan Los parámetros autorregresivos y de media móvil para los diferentes desfases. Puede utilizar cualquier nombre que desee para estas variables, y hay muchas formas equivalentes de que la especificación podría ser escrita. Los procesos ARMA vectoriales también se pueden estimar con PROC MODEL. Por ejemplo, un proceso AR (1) de dos variables para los errores de las dos variables endógenas Y1 e Y2 puede especificarse de la siguiente manera: Problemas de Convergencia con Modelos ARMA Los modelos ARMA pueden ser difíciles de estimar. Si las estimaciones de parámetros no están dentro del intervalo apropiado, los términos residuales de modelos de media móvil crecen exponencialmente. Los residuos calculados para observaciones posteriores pueden ser muy grandes o pueden desbordarse. Esto puede ocurrir ya sea porque se utilizaron valores iniciales incorrectos o porque las iteraciones se alejaron de valores razonables. Se debe tener cuidado al elegir los valores iniciales para los parámetros ARMA. Los valores iniciales de 0,001 para los parámetros ARMA normalmente funcionan si el modelo se ajusta bien a los datos y el problema está bien condicionado. Tenga en cuenta que un modelo de MA a menudo puede ser aproximado por un modelo de AR de alto orden, y viceversa. Esto puede dar lugar a una alta colinealidad en los modelos ARMA mixtos, lo que a su vez puede causar un grave mal acondicionamiento en los cálculos y la inestabilidad de los parámetros estimados. Si tiene problemas de convergencia mientras estima un modelo con procesos de error ARMA, intente estimarlos en pasos. En primer lugar, utilice una sentencia FIT para estimar sólo los parámetros estructurales con los parámetros ARMA mantenidos a cero (o a estimaciones previas razonables si están disponibles). A continuación, utilice otra instrucción FIT para estimar sólo los parámetros ARMA, utilizando los valores de los parámetros estructurales de la primera ejecución. Dado que los valores de los parámetros estructurales es probable que estén cerca de sus estimaciones finales, las estimaciones de los parámetros de ARMA podrían ahora converger. Finalmente, use otra instrucción FIT para producir estimaciones simultáneas de todos los parámetros. Dado que los valores iniciales de los parámetros ahora es probable que estén muy cerca de sus estimaciones conjuntas finales, las estimaciones deben converger rápidamente si el modelo es apropiado para los datos. AR Condiciones iniciales Los retornos iniciales de los términos de error de los modelos AR (p) pueden modelarse de diferentes maneras. Los métodos de arranque de errores autorregresivos soportados por los procedimientos SAS / ETS son los siguientes: mínimos cuadrados condicionales (procedimientos ARMA y MODELO) mínimos cuadrados incondicionales (procedimientos AUTOREG, ARIMA y MODELO) Yule-Walker (Procedimiento AUTOREG solamente) Hildreth-Lu, que elimina las primeras p observaciones (procedimiento MODEL solamente) Consulte el Capítulo 8, Procedimiento AUTOREG, para una explicación y discusión de los méritos de varios métodos de arranque AR (p). Las inicializaciones CLS, ULS, ML y HL pueden realizarse mediante PROC MODEL. Para errores AR (1), estas inicializaciones se pueden producir como se muestra en la Tabla 18.2. Estos métodos son equivalentes en muestras grandes. Tabla 18.2 Inicializaciones realizadas por PROC MODEL: AR (1) ERRORES Los retornos iniciales de los términos de error de los modelos MA (q) también se pueden modelar de diferentes maneras. Los siguientes paradigmas de inicio de error de media móvil son soportados por los procedimientos ARIMA y MODELO: mínimos cuadrados incondicionales mínimos condicionales condicionales El método de mínimos cuadrados condicionales para estimar los términos de error de media móvil no es óptimo porque ignora el problema de inicio. Esto reduce la eficiencia de las estimaciones, aunque siguen siendo imparciales. Los residuos rezagados iniciales, que se extienden antes del inicio de los datos, se supone que son 0, su valor esperado incondicional. Esto introduce una diferencia entre estos residuales y los residuos de mínimos cuadrados generalizados para la covarianza media móvil que, a diferencia del modelo autorregresivo, persiste a través del conjunto de datos. Por lo general, esta diferencia converge rápidamente a 0, pero para los procesos de media móvil no inversa la convergencia es bastante lenta. Para minimizar este problema, debe tener un montón de datos, y las estimaciones de parámetros del promedio móvil deberían estar dentro del intervalo invertible. Este problema se puede corregir a expensas de escribir un programa más complejo. Las estimaciones de mínimos cuadrados incondicionales para el proceso MA (1) se pueden producir especificando el modelo de la siguiente manera: Los errores de media móvil pueden ser difíciles de estimar. Debe considerar usar una aproximación AR (p) al proceso del promedio móvil. Un proceso de media móvil normalmente puede ser bien aproximado por un proceso autorregresivo si los datos no han sido suavizados o diferenciados. La macro AR La macro AR de SAS genera instrucciones de programación para el MODELO PROC para modelos autorregresivos. La macro AR forma parte del software SAS / ETS y no es necesario configurar ninguna opción especial para utilizar la macro. El proceso autorregresivo puede aplicarse a los errores de la ecuación estructural oa las propias series endógenas. La macro AR puede utilizarse para los siguientes tipos de autorregresión: autorreversión vectorial sin restricciones autorregresión vectorial restringida Autoregresión univariable Para modelar el término de error de una ecuación como un proceso autorregresivo, utilice la siguiente sentencia después de la ecuación: Por ejemplo, supongamos que Y es una Función lineal de X1, X2 y un error AR (2). Escribirías este modelo de la siguiente manera: Las llamadas a AR deben venir después de todas las ecuaciones a las que se aplica el proceso. La invocación de macros anterior, AR (y, 2), produce las declaraciones mostradas en la salida LIST de la Figura 18.58. Figura 18.58 Salida de opción LIST para un modelo AR (2) Las variables prefijadas PRED son variables temporales del programa utilizadas para que los retrasos de los residuos sean los residuos correctos y no los redefinidos por esta ecuación. Tenga en cuenta que esto es equivalente a las declaraciones explícitamente escritas en la sección Formulario General para Modelos ARMA. También puede restringir los parámetros autorregresivos a cero en los retornos seleccionados. Por ejemplo, si desea parámetros autorregresivos en los retornos 1, 12 y 13, puede utilizar las siguientes sentencias: Estas instrucciones generan la salida que se muestra en la Figura 18.59. Figura 18.59 Salida de opción de LIST para un modelo de AR con Lags en 1, 12 y 13 El listado de procedimientos MODEL de la declaración de código de programa compilado como analizado PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y PRED. y - y Hay Variaciones en el método de los mínimos cuadrados condicionales, dependiendo de si las observaciones al comienzo de la serie se utilizan para calentar el proceso AR. De forma predeterminada, el método de mínimos cuadrados condicionales de AR utiliza todas las observaciones y supone ceros para los retardos iniciales de los términos autorregresivos. Utilizando la opción M, puede solicitar que AR utilice el método de mínimos cuadrados incondicionales (ULS) o de máxima verosimilitud (ML). Por ejemplo, las discusiones de estos métodos se proporcionan en la sección AR Condiciones iniciales. Mediante el uso de la opción MCLS n, puede solicitar que las primeras n observaciones se utilicen para calcular estimaciones de los retrasos autorregresivos iniciales. En este caso, el análisis comienza con la observación n 1. Por ejemplo: Puede utilizar la macro AR para aplicar un modelo autorregresivo a la variable endógena, en lugar del término de error, mediante la opción TYPEV. Por ejemplo, si desea agregar los cinco retrasos anteriores de Y a la ecuación del ejemplo anterior, podría utilizar AR para generar los parámetros y los retrasos mediante las siguientes sentencias: Las sentencias anteriores generan la salida que se muestra en la Figura 18.60. Figura 18.60 Salida de la opción LIST para un modelo AR de Y Este modelo predice Y como una combinación lineal de X1, X2, una intersección y los valores de Y en los cinco períodos más recientes. Autoregresión vectorial sin restricciones Para modelar los términos de error de un conjunto de ecuaciones como un proceso autorregresivo vectorial, utilice la siguiente forma de la macro AR después de las ecuaciones: El valor del nombre del proceso es cualquier nombre que suministre para que AR utilice para crear nombres para el autorregresivo Parámetros. Puede utilizar la macro AR para modelar varios procesos AR diferentes para diferentes conjuntos de ecuaciones utilizando diferentes nombres de proceso para cada conjunto. El nombre del proceso garantiza que los nombres de variable utilizados sean únicos. Utilice un valor de nombre de proceso corto para el proceso si las estimaciones de parámetros se escriben en un conjunto de datos de salida. La macro AR intenta construir nombres de parámetro menores o iguales a ocho caracteres, pero esto está limitado por la longitud de nombreproceso. Que se utiliza como prefijo para los nombres de parámetro AR. El valor de variablelist es la lista de variables endógenas para las ecuaciones. Por ejemplo, supongamos que los errores de las ecuaciones Y1, Y2 e Y3 son generados por un proceso autorregresivo vectorial de segundo orden. Puede utilizar las siguientes sentencias: que generan lo siguiente para Y1 y código similar para Y2 e Y3: Sólo el método de mínimos cuadrados condicionales (MCLS o MCLS n) se puede utilizar para procesos vectoriales. También puede usar el mismo formulario con restricciones de que la matriz de coeficientes sea 0 en retrasos seleccionados. Por ejemplo, las siguientes afirmaciones aplican un proceso vectorial de tercer orden a los errores de ecuación con todos los coeficientes con retraso 2 restringido a 0 y con los coeficientes en los retornos 1 y 3 sin restricciones: Puede modelar las tres series Y1Y3 como un proceso vectorial autorregresivo En las variables en lugar de en los errores mediante la opción TYPEV. Si desea modelar Y1Y3 como una función de valores pasados ​​de Y1Y3 y algunas variables o constantes exógenas, puede usar AR para generar las sentencias para los términos de retraso. Escriba una ecuación para cada variable para la parte no autorregresiva del modelo, y luego llame a AR con la opción TYPEV. Por ejemplo, la parte no autorregresiva del modelo puede ser una función de variables exógenas, o puede ser parámetros de intercepción. Si no hay componentes exógenos en el modelo de autorregresión vectorial, incluyendo no intercepciones, entonces asigne cero a cada una de las variables. Debe haber una asignación a cada una de las variables antes de que AR se llame. Este ejemplo modela el vector Y (Y1 Y2 Y3) como una función lineal solamente de su valor en los dos períodos anteriores y un vector de error de ruido blanco. El modelo tiene 18 (3 3 3 3) parámetros. Sintaxis de la macro AR Hay dos casos de la sintaxis de la macro AR. Cuando no se necesitan restricciones en un proceso AR vectorial, la sintaxis de la macro AR tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarios para definir el proceso AR. Si el endolist no se especifica, la lista endógena tiene por defecto el nombre. Que debe ser el nombre de la ecuación a la que se va a aplicar el proceso de error AR. El valor de nombre no puede superar los 32 caracteres. Es el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Si se da más de un nombre, se crea un proceso vectorial sin restricciones con los residuos estructurales de todas las ecuaciones incluidas como regresores en cada una de las ecuaciones. Si no se especifica, endolist toma el nombre por defecto. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos a intervalos no listados se ponen a 0. Todos los desfases enumerados deben ser menores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación. Los métodos ULS y ML no son compatibles con modelos AR vectoriales por AR. Especifica que el proceso AR debe aplicarse a las variables endógenas en lugar de a los residuos estructurales de las ecuaciones. Autoregresión vectorial restringida Puede controlar qué parámetros se incluyen en el proceso, restringiendo a 0 aquellos parámetros que no incluye. Primero, use AR con la opción DEFER para declarar la lista de variables y definir la dimensión del proceso. A continuación, utilice llamadas AR adicionales para generar términos para las ecuaciones seleccionadas con variables seleccionadas en retrasos seleccionados. Por ejemplo, las ecuaciones de error producidas son las siguientes: Este modelo establece que los errores para Y1 dependen de los errores de Y1 y Y2 (pero no de Y3) en ambos rezagos 1 y 2 y que los errores para Y2 y Y3 dependen de Los errores anteriores para las tres variables, pero sólo con retraso 1. AR Macro Sintaxis para AR Restringido AR Un uso alternativo de AR se permite imponer restricciones en un proceso AR vector llamando a AR varias veces para especificar diferentes términos de AR y rezagos para diferentes Ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que AR utilice en la construcción de nombres de variables necesarias para definir el proceso vector AR. Especifica el orden del proceso AR. Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Especifica que AR no es para generar el proceso AR, sino que es esperar la información adicional especificada en las llamadas AR posteriores para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que deben aplicarse las especificaciones de esta llamada AR. Sólo los nombres especificados en el valor endolist de la primera llamada para el valor de nombre pueden aparecer en la lista de ecuaciones de eqlist. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Solamente los nombres en el endolist de la primera llamada para el valor del nombre pueden aparecer en varlist. Si no se especifica, varlist por defecto es endolist. Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos en retrasos no enumerados se establecen en 0. Todos los retornos enumerados deben ser inferiores o iguales al valor de nlag. Y no debe haber duplicados. Si no se especifica, laglist se ajusta por defecto a todos los retornos 1 a nlag. La macro MA La macro MA SAS genera instrucciones de programación para MODELO PROC para modelos de media móvil. La macro MA forma parte del software SAS / ETS y no se necesitan opciones especiales para utilizar la macro. El proceso de error de media móvil puede aplicarse a los errores de la ecuación estructural. La sintaxis de la macro MA es la misma que la macro AR excepto que no hay ningún argumento TYPE. Cuando está utilizando las macros MA y AR combinadas, la macro MA debe seguir la macro AR. Las siguientes instrucciones SAS / IML producen un proceso de error ARMA (1, (1 3)) y lo guardan en el conjunto de datos MADAT2. Las siguientes instrucciones PROC MODEL se usan para estimar los parámetros de este modelo usando la estructura de error de máxima verosimilitud: Las estimaciones de los parámetros producidos por esta ejecución se muestran en la Figura 18.61. Figura 18.61 Estimaciones de un proceso ARMA (1, (1 3)) Hay dos casos de la sintaxis para la macro MA. Cuando no se necesitan restricciones en un proceso MA vectorial, la sintaxis de la macro MA tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA y es el endolist predeterminado. Es el orden del proceso MA. Especifica las ecuaciones a las que se aplica el proceso de MA. Si se da más de un nombre, la estimación CLS se utiliza para el proceso vectorial. Especifica los rezagos en los que se van a agregar los términos MA. Todos los desfases enumerados deben ser inferiores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag. Especifica el método de estimación a implementar. Los valores válidos de M son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). MCLS es el valor predeterminado. Sólo se permite MCLS cuando se especifica más de una ecuación en el endolist. MA Sintaxis de macros para movimientos restringidos de medios móviles Un uso alternativo de MA permite imponer restricciones a un proceso de MA vectorial llamando a MA varias veces para especificar diferentes términos de MA y rezagos para diferentes ecuaciones. La primera llamada tiene la forma general especifica un prefijo para que MA utilice en la construcción de nombres de variables necesarias para definir el proceso MA vector. Especifica el orden del proceso MA. Especifica la lista de ecuaciones a las que se aplicará el proceso de MA. Especifica que MA no es para generar el proceso MA sino que es esperar a que la información adicional especificada en las llamadas MA más recientes para el mismo valor de nombre. Las llamadas siguientes tienen la forma general es la misma que en la primera llamada. Especifica la lista de ecuaciones a las que se aplicarán las especificaciones de esta llamada MA. Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Especifica la lista de rezagos a los que se van a añadir los términos MA. En la práctica, el promedio móvil proporcionará una buena estimación de la media de las series temporales si la media es constante o cambia lentamente. En el caso de una media constante, el mayor valor de m dará las mejores estimaciones de la media subyacente. Un período de observación más largo promediará los efectos de la variabilidad. El propósito de proporcionar un m más pequeño es permitir que el pronóstico responda a un cambio en el proceso subyacente. Para ilustrar, proponemos un conjunto de datos que incorpora cambios en la media subyacente de la serie temporal. La figura muestra las series temporales utilizadas para la ilustración junto con la demanda media a partir de la cual se generó la serie. La media comienza como una constante en 10. Comenzando en el tiempo 21, aumenta en una unidad en cada período hasta que alcanza el valor de 20 en el tiempo 30. Entonces se vuelve constante otra vez. Los datos se simulan sumando a la media un ruido aleatorio de una distribución Normal con media cero y desviación estándar 3. Los resultados de la simulación se redondean al entero más próximo. La tabla muestra las observaciones simuladas utilizadas para el ejemplo. Cuando usamos la tabla, debemos recordar que en cualquier momento dado, sólo se conocen los datos pasados. Las estimaciones del parámetro del modelo, para tres valores diferentes de m se muestran junto con la media de las series temporales de la siguiente figura. La figura muestra la media móvil de la estimación de la media en cada momento y no la previsión. Los pronósticos cambiarían las curvas de media móvil a la derecha por períodos. Una conclusión es inmediatamente aparente de la figura. Para las tres estimaciones, la media móvil se queda por detrás de la tendencia lineal, con el retardo aumentando con m. El retraso es la distancia entre el modelo y la estimación en la dimensión temporal. Debido al desfase, el promedio móvil subestima las observaciones a medida que la media aumenta. El sesgo del estimador es la diferencia en un tiempo específico en el valor medio del modelo y el valor medio predicho por el promedio móvil. El sesgo cuando la media está aumentando es negativo. Para una media decreciente, el sesgo es positivo. El retraso en el tiempo y el sesgo introducido en la estimación son funciones de m. Cuanto más grande sea el valor de m. Mayor es la magnitud del retraso y sesgo. Para una serie cada vez mayor con tendencia a. Los valores de retraso y sesgo del estimador de la media se dan en las ecuaciones siguientes. Las curvas de ejemplo no coinciden con estas ecuaciones porque el modelo de ejemplo no está aumentando continuamente, sino que comienza como una constante, cambia a una tendencia y luego vuelve a ser constante de nuevo. También las curvas de ejemplo se ven afectadas por el ruido. El pronóstico de media móvil de los períodos en el futuro se representa desplazando las curvas hacia la derecha. El desfase y sesgo aumentan proporcionalmente. Las ecuaciones a continuación indican el retraso y sesgo de los períodos de previsión en el futuro en comparación con los parámetros del modelo. Nuevamente, estas fórmulas son para una serie de tiempo con una tendencia lineal constante. No debemos sorprendernos de este resultado. El estimador del promedio móvil se basa en el supuesto de una media constante, y el ejemplo tiene una tendencia lineal en la media durante una parte del período de estudio. Dado que las series de tiempo real rara vez obedecerán exactamente las suposiciones de cualquier modelo, debemos estar preparados para tales resultados. Podemos también concluir de la figura que la variabilidad del ruido tiene el efecto más grande para m más pequeño. La estimación es mucho más volátil para el promedio móvil de 5 que el promedio móvil de 20. Tenemos los deseos en conflicto de aumentar m para reducir el efecto de la variabilidad debido al ruido y disminuir m para hacer el pronóstico más sensible a los cambios En promedio El error es la diferencia entre los datos reales y el valor previsto. Si la serie temporal es verdaderamente un valor constante, el valor esperado del error es cero y la varianza del error está compuesta por un término que es una función de y un segundo término que es la varianza del ruido. El primer término es la varianza de la media estimada con una muestra de m observaciones, suponiendo que los datos provienen de una población con una media constante. Este término se minimiza haciendo m tan grande como sea posible. Un m grande hace que el pronóstico no responda a un cambio en la serie temporal subyacente. Para hacer que el pronóstico responda a los cambios, queremos que m sea lo más pequeño posible (1), pero esto aumenta la varianza del error. La predicción práctica requiere un valor intermedio. Previsión con Excel El complemento de previsión implementa las fórmulas de promedio móvil. El siguiente ejemplo muestra el análisis proporcionado por el complemento para los datos de muestra en la columna B. Las primeras 10 observaciones se indexan -9 a 0. En comparación con la tabla anterior, los índices de período se desplazan en -10. Las primeras diez observaciones proporcionan los valores iniciales para la estimación y se utilizan para calcular la media móvil para el período 0. La columna MA (10) (C) muestra las medias móviles calculadas. El parámetro de la media móvil m está en la celda C3. La columna Fore (1) (D) muestra un pronóstico para un período en el futuro. El intervalo de pronóstico está en la celda D3. Cuando el intervalo de pronóstico se cambia a un número mayor, los números de la columna Fore se desplazan hacia abajo. La columna Err (1) (E) muestra la diferencia entre la observación y el pronóstico. Por ejemplo, la observación en el tiempo 1 es 6. El valor pronosticado a partir de la media móvil en el tiempo 0 es 11.1. El error entonces es -5.1. La desviación estándar y la media de la desviación media (MAD) se calculan en las celdas E6 y E7 respectivamente.2.1 Modelos de media móvil (modelos MA) Los modelos de series de tiempo conocidos como modelos ARIMA pueden incluir términos autorregresivos y / o términos de media móvil. En la semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor retrasado de x t. Por ejemplo, un término autorregresivo de retardo 1 es x t-1 (multiplicado por un coeficiente). Esta lección define los términos del promedio móvil. Un término medio móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente). Dejamos (wt desbordamiento N (0, sigma2w)), lo que significa que los w t son idéntica, independientemente distribuidos, cada uno con una distribución normal que tiene la media 0 y la misma varianza. El modelo de media móvil de primer orden, denotado por MA (1) es (xt mu wt theta1w) El modelo de media móvil de segundo orden, denotado por MA (2) es (xt mu wt theta1w theta2w) , Denotado por MA (q) es (xt mu wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque sí cambia los signos algebraicos de los valores estimados de los coeficientes y los términos (no cuadrados) en las fórmulas para las ACF y las varianzas. Usted necesita comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza signos positivos en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie temporal con un modelo MA (1) Tenga en cuenta que el único valor distinto de cero en el ACF teórico es para el retardo 1. Todas las demás autocorrelaciones son 0. Por lo tanto, una muestra de ACF con una autocorrelación significativa sólo con el retardo 1 es un indicador de un posible modelo MA (1). Para los estudiantes interesados, las pruebas de estas propiedades son un apéndice a este folleto. Ejemplo 1 Supongamos que un modelo MA (1) es x t 10 w t .7 w t-1. Donde (wt overset N (0,1)). Así, el coeficiente 1 0,7. El ACF teórico se da por un diagrama de esta ACF sigue. La gráfica que se muestra es la ACF teórica para una MA (1) con 1 0,7. En la práctica, una muestra no suele proporcionar un patrón tan claro. Utilizando R, simulamos n 100 valores de muestra utilizando el modelo x t 10 w t .7 w t-1 donde w t iid N (0,1). Para esta simulación, sigue un diagrama de series de tiempo de los datos de la muestra. No podemos decir mucho de esta trama. A continuación se muestra el ACF de muestra para los datos simulados. Observamos un pico en el retraso 1 seguido por valores generalmente no significativos para los retrasos de 1. Obsérvese que la muestra ACF no coincide con el patrón teórico del MA subyacente (1), que es que todas las autocorrelaciones para los retrasos de 1 serán 0.Una muestra diferente tendría una ACF de muestra ligeramente diferente mostrada abajo, pero probablemente tendría las mismas características amplias. Propiedades Terapéuticas de una Serie de Tiempo con un Modelo MA (2) Para el modelo MA (2), las propiedades teóricas son las siguientes: Obsérvese que los únicos valores distintos de cero en la ACF teórica son para los retornos 1 y 2. Las autocorrelaciones para retardos mayores son 0 . Por lo tanto, una muestra de ACF con autocorrelaciones significativas en los intervalos 1 y 2, pero autocorrelaciones no significativas para retardos mayores, indica un posible modelo MA (2). Iid N (0,1). Los coeficientes son 1 0,5 y 2 0,3. Dado que se trata de una MA (2), la ACF teórica tendrá valores distintos de cero sólo en los retornos 1 y 2. Los valores de las dos autocorrelaciones distintas de cero son: Un gráfico de la ACF teórica sigue. Como casi siempre es el caso, los datos de la muestra no se comportarán tan perfectamente como la teoría. Se simularon 150 valores de muestra para el modelo x t 10 w t .5 w t-1 .3 w t-2. Donde w t iid N (0,1). A continuación se muestra el gráfico de la serie de tiempo de los datos. Al igual que con el gráfico de la serie de tiempo para los datos de la muestra MA (1), no se puede decir mucho de ella. A continuación se muestra el ACF de muestra para los datos simulados. El patrón es típico para situaciones donde un modelo MA (2) puede ser útil. Hay dos picos estadísticamente significativos en los intervalos 1 y 2, seguidos de valores no significativos para otros desfases. Tenga en cuenta que debido al error de muestreo, la muestra ACF no coincide exactamente con el patrón teórico. ACF para modelos MA (q) Una propiedad de los modelos MA (q) en general es que hay autocorrelaciones no nulas para los primeros q retrasos y autocorrelaciones 0 para todos los retrasos gt q. No unicidad de la conexión entre los valores de 1 y (rho1) en MA (1) Modelo. En el modelo MA (1), para cualquier valor de 1. El 1/1 recíproco da el mismo valor para. Por ejemplo, use 0.5 para 1. Y luego utilice 1 / (0,5) 2 para 1. Youll get (rho1) 0.4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. Limitamos los modelos MA (1) a tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 será un valor de parámetro permisible, mientras que 1 1 / 0,5 2 no. Invertibilidad de los modelos MA Se dice que un modelo MA es invertible si es algebraicamente equivalente a un modelo de orden infinito convergente. Al converger, queremos decir que los coeficientes de AR disminuyen a 0 a medida que retrocedemos en el tiempo. Invertibilidad es una restricción programada en el software de la serie de tiempo usado para estimar los coeficientes de modelos con términos de MA. No es algo que buscamos en el análisis de datos. En el apéndice se proporciona información adicional sobre la restricción de la invertibilidad para los modelos MA (1). Nota de Teoría Avanzada. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para la invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - q y q 0 tiene soluciones para y que caen fuera del círculo unitario. Código R para los Ejemplos En el Ejemplo 1, se representó la ACF teórica del modelo x $ _ {t} $ w $ _ {t} $. 7w t - 1. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R usados ​​para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0.7), lag. max10) 10 retardos de ACF para MA (1) con theta1 0.7 lags0: 10 crea una variable llamada lags que va de 0 a 10. plot Abline (h0) añade un eje horizontal al diagrama El primer comando determina el ACF y lo almacena en un objeto (a0) Llamado acfma1 (nuestra elección de nombre). El comando plot (el 3er comando) traza retrasos en comparación con los valores ACF para los retornos 1 a 10. El parámetro ylab etiqueta el eje y y el parámetro principal pone un título en la gráfica. Para ver los valores numéricos de la ACF simplemente utilice el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. Xcarzim. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 agrega 10 para hacer la media 10. La simulación predeterminada significa 0. plot (x, typeb, mainSimulated MA (1) data) (X, xlimc (1,10), mainACF para datos de muestra simulados) En el Ejemplo 2, se representó el ACF teórico del modelo xt 10 wt. 5 w t-1 .3 w t-2. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 trama (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) con theta1 0,5, (X, typeb, principal serie MA simulado) acf (x, xlimc (1,10), x2) (1) Para los estudiantes interesados, aquí hay pruebas de las propiedades teóricas del modelo MA (1). Cuando x 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 (x) La razón es que, por definición de independencia del peso. E (w k w j) 0 para cualquier k j. Además, debido a que w t tiene una media 0, E (w j w j) E (w j 2) w 2. Para una serie de tiempo, aplique este resultado para obtener la ACF dada anteriormente. Un modelo inversible MA es uno que puede ser escrito como un modelo de orden infinito AR que converge para que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el modelo MA (1). A continuación, sustituimos la relación (2) por wt-1 en la ecuación (1) (3) (zt wt theta1 (z-theta1w) wt theta1z - theta2w) En el momento t-2. La ecuación (2) es entonces sustituimos la relación (4) por w t-2 en la ecuación (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si continuáramos Sin embargo, si 1 1, los coeficientes que multiplican los retrasos de z aumentarán (infinitamente) en tamaño a medida que retrocedemos hacia atrás hora. Para evitar esto, necesitamos 1 lt1. Esta es la condición para un modelo de MA (1) invertible. Infinite Order MA model En la semana 3, veamos bien que un modelo AR (1) puede convertirse en un modelo de orden infinito MA: (xt - mu wt phi1w phi21w puntos phik1 w dots sum phij1w) Esta suma de términos de ruido blanco pasado es conocida Como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos remontándose en el tiempo. Esto se llama un orden infinito MA o MA (). Una orden finita MA es un orden infinito AR y cualquier orden finito AR es un orden infinito MA. Recordemos en la semana 1, observamos que un requisito para un AR estacionario (1) es que 1 lt1. Vamos a calcular el Var (x t) utilizando la representación causal. Este último paso utiliza un hecho básico sobre series geométricas que requiere (phi1lt1) de lo contrario la serie diverge. Navegación

No comments:

Post a Comment