Monday, October 24, 2016

Difference Between Moving Average And Autoregressive Model

Un RIMA significa autorregresivos integrados en movimiento modelos Promedio. Univariado (solo vector) ARIMA es una técnica de predicción que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su principal aplicación es en el área de predicción a corto plazo que requiere un mínimo de 40 puntos de datos históricos. Funciona mejor cuando sus datos exhibe un patrón estable o constante en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de que los autores originales), ARIMA es generalmente superior a técnicas de suavizado exponencial cuando los datos son razonablemente largo y la correlación entre las observaciones anteriores es estable. Si los datos son de corto o muy volátiles, y luego algún método de alisado puede funcionar mejor. Si usted no tiene al menos 38 puntos de datos, se debe considerar otro método que no ARIMA. El primer paso en la aplicación de la metodología ARIMA es para comprobar si hay estacionariedad. Estacionariedad implica que la serie se mantiene en un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, a continuación, sus datos no es estacionaria. Los datos también debe mostrar una varianza constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y crece a un ritmo más rápido. En tal caso, las subidas y bajadas en la estacionalidad se harán más dramática en el tiempo. Sin estas condiciones de estacionariedad se cumplen, muchos de los cálculos asociados con el proceso no se puede calcular. Si una representación gráfica de los datos indica no estacionariedad, entonces debería diferencia de la serie. La diferenciación es una excelente manera de transformar una serie no estacionaria a uno estacionario. Esto se realiza restando la observación en el periodo actual de la anterior. Si esta transformación se realiza sólo una vez para una serie, se dice que los datos han sido primera diferenciados. Este proceso elimina esencialmente la tendencia si la serie está creciendo a un ritmo bastante constante. Si está creciendo a un ritmo creciente, se puede aplicar el mismo procedimiento y la diferencia de los datos de nuevo. Sus datos serían entonces segundo diferenciada. Autocorrelaciones son valores numéricos que indican cómo una serie de datos está relacionado con sí mismo en el tiempo. Más precisamente, se mide la fuerza con los valores de datos en un número especificado de periodos aparte se correlacionan entre sí en el tiempo. El número de períodos separados generalmente se llama el retraso. Por ejemplo, una autocorrelación en medidas de retardo 1 cómo valora 1 periodo aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso de 2 medidas de cómo los datos de dos períodos separados están correlacionadas en toda la serie. Autocorrelaciones pueden variar 1--1. Un valor cercano a 1 indica una correlación positiva alta, mientras que un valor cercano a -1 indica una correlación negativa alta. Estas medidas son más a menudo evaluados a través de representaciones gráficas llamadas correlagrams. Un correlagram representa los valores de autocorrelación para una serie dada en diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. metodología ARIMA intenta describir los movimientos de una serie de tiempo estacionaria en función de lo que se denomina autorregresivo y moviendo parámetros medios. Estos se conocen como parámetros AR (autoregessive) y los parámetros MA (promedios móviles). Un modelo AR con sólo 1 de parámetros se puede escribir como. X (t) Un (1) X (t-1) E (t) en la que X (t) de series de tiempo bajo investigación Un (1) el parámetro autorregresivo de orden 1 X (t-1) las series de tiempo se retrasó 1 periodo E (t) el término de error del modelo Esto simplemente significa que cualquier valor dado de X (t) puede explicarse por alguna función de su valor anterior, X (t-1), además de algunos errores aleatorios inexplicable, E (t). Si el valor estimado de A (1) fue 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionado con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), además de algunos al azar de error e (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Mover Modelos Promedio: Un segundo tipo de modelo de Box-Jenkins se llama un modelo de media móvil. Aunque estos modelos son muy similares al modelo AR, el concepto detrás de ellos es muy diferente. Móviles parámetros medios relacionan lo que ocurre en el período t sólo a los errores aleatorios que ocurrieron en periodos pasados, es decir, E (t-1), E (t-2), etc en lugar de X (t-1), X ( t-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA se puede escribir de la siguiente manera. X (t) - B (1) E (t-1) E (t) El término B (1) se llama un MA de orden 1. El signo negativo delante del parámetro se utiliza para la única convención y por lo general se imprime a cabo automáticamente por la mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente con el error aleatorio en el periodo anterior, E (t-1), y con el término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil se pueden extender a estructuras de orden superior que cubren diferentes combinaciones y en movimiento longitudes medias. metodología ARIMA también permite que los modelos que se construirán que incorporan tanto autorregresivo y moviendo parámetros medios juntos. Estos modelos se conocen como modelos mixtos a menudo. Aunque esto lo convierte en una herramienta de pronóstico más complicado, de hecho, la estructura puede simular la serie mejor y producir un pronóstico más exacto. modelos puros implican que la estructura se compone sólo de los parámetros AR o MA - no ambas. Los modelos desarrollados por este enfoque generalmente se llaman los modelos ARIMA, ya que utilizan una combinación de autorregresivo (AR), la integración (I) - refiriéndose al proceso de diferenciación inversa para producir el pronóstico, y moviendo las operaciones promedio (MA). Un modelo ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (P), el número de operadores de diferenciación (d), y el más alto orden del plazo de media móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo de segundo orden autorregresivo de primer orden con un componente promedio cuya serie se ha diferenciado una vez para inducir estacionariedad en movimiento. Recogiendo la Especificación de la derecha: El principal problema en la clásica Box-Jenkins está tratando de decidir qué especificación ARIMA utilizar - i. e. cuántos parámetros AR y / o MA que incluyen. Esto es lo que gran parte de la caja-Jenkings 1976 se dedicó al proceso de identificación. Dependía de gráfica y numérica eva - luación de la autocorrelación de la muestra y las funciones de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en la complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, los datos representan solamente una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, error de medición, etc.) pueden distorsionar el proceso de identificación teórica. Es por ello que la modelización ARIMA tradicional es más un arte que una science. There una serie de enfoques para el modelado de series temporales. Esbozamos algunos de los enfoques más comunes a continuación. Tendencia, estacional, Descomposiciones residuales Un método consiste en descomponer la serie temporal en una tendencia, estacional y componente residual. suavizado exponencial Triple es un ejemplo de este enfoque. Otro ejemplo, llamado loess estacional, se basa en mínimos cuadrados ponderados localmente y es discutido por Cleveland (1993). No hablamos de loess de temporada en este manual. Métodos basados ​​frecuencia Otro enfoque, que se utiliza comúnmente en aplicaciones científicas y de ingeniería, es analizar la serie en el dominio de la frecuencia. Un ejemplo de este enfoque en el modelado de un conjunto de datos de tipo sinusoidal se muestra en el estudio de caso de desviación del rayo. La trama espectral es la principal herramienta para el análisis de frecuencia de las series temporales. Autorregresivo (AR) Modelos Un enfoque común para la modelización de series temporales univariado es el modelo autorregresivo (AR): Xt delta phi1 X phi2 X cdots phip X A, donde (Xt) es la serie de tiempo, (A) es ruido blanco, y delta la izquierda (1 - suma p phii derecha) mu. con (mu) que indica la media del proceso. Un modelo autorregresivo es simplemente una regresión lineal del valor actual de la serie contra uno o más valores anteriores de la serie. El valor de (p) se denomina el orden del modelo de AR. modelos AR se pueden analizar con uno de varios métodos, incluyendo lineal por mínimos cuadrados técnicas estándar. También tienen una interpretación sencilla. Media móvil (MA) Modelos Otro enfoque común para el modelado de modelos de series temporales univariantes es el modelo de media móvil (MA): Xt mu A - theta1 A - theta2 A - cdots - thetaq A, donde (Xt) es la serie de tiempo, (mu ) es la media de la serie, (A) están términos de ruido blanco, y (theta1,, ldots,, thetaq) son los parámetros del modelo. El valor de (q) se denomina el orden del modelo de MA. Es decir, un modelo de promedio móvil es conceptualmente una regresión lineal del valor actual de la serie contra el ruido blanco o perturbaciones aleatorias de uno o más valores anteriores de la serie. Los choques aleatorios en cada punto se supone que proceden de la misma distribución, típicamente una distribución normal, con la ubicación en cero y la escala constante. La distinción de este modelo es que estas perturbaciones aleatorias son propagados a los valores futuros de la serie temporal. Montaje de las estimaciones MA es más complicado que con los modelos AR debido a que los términos de error no son observables. Esto significa que los procedimientos de ajuste iterativo no lineal necesitan ser utilizados en lugar de los mínimos cuadrados lineales. MA modelos también tienen una interpretación menos evidente que los modelos AR. A veces, la FAS y la FAP se sugiere que un modelo MA sería una mejor opción de modelo y en ocasiones ambos términos AR y MA se debe utilizar en el mismo modelo (véase la Sección 6.4.4.5). Tenga en cuenta, sin embargo, que los términos de error después de que el modelo es ajustado debe ser independiente y siguen los supuestos estándar para un proceso univariado. Box y Jenkins popularizó un enfoque que combina los enfoques de la media y la autorregresivos móviles en el análisis de series temporales libro: Predicción y Control (cuadro, Jenkins, y Reinsel, 1994). Aunque ambos enfoques promedio autorregresivos y móviles ya eran conocidos (y fueron investigados originalmente por Yule), la contribución de Box y Jenkins era en el desarrollo de una metodología sistemática para identificar y estimar los modelos que podrían incorporar ambos enfoques. Esto hace que los modelos Box-Jenkins una clase poderosa de modelos. Las siguientes secciones discutirán estos modelos en detail. Before 1970, econometría y analistas de series de tiempo usado métodos muy diferentes para modelar una serie de tiempo. Económetras modelado de series temporales son una regresión lineal estándar con variables explicativas que sugiere la teoría económica / intuición para explicar los movimientos de los datos de series temporales. Se supone que la serie de momento no estacionario (crecimiento horas extras) no tuvo ningún efecto en su análisis empírico. analistas de series de tiempo, por otro lado ignoran este análisis econométrico tradicional. Modelaron una serie de tiempo como una función de sus valores pasados. Se trabajó en torno al problema de la no estacionariedad diferenciando los datos para que sea estacionaria. Entonces, Clive Granger y Paul Newbold sucedieron 1. Los econometristas se vieron obligados a prestar atención a los métodos de los analistas de series de tiempo, el más famoso de los cuales fue el BoxJenkins enfoque desarrollado por George P Box y Jenkins Gwilym y publicados en su legendaria monografía análisis de series temporales : Predicción y control 2. Box y Jenkins afirmaron (con éxito) que los datos no estacionarios se pueden hacer estacionario diferenciando la serie. Esta serie, Mathy / matemáticas es la entrada en el análisis de Box-Jenkins. El modelo general para Mathy / matemáticas se escribe como, mathYphi1Y phi2Y. phipY theta2epsilon epsilonttheta1epsilon. thetaqepsilon / matemáticas donde mathphi / matemáticas y maththeta / matemáticas son parámetros desconocidos y mathepsilon / matemáticas son independientes idénticamente distribuidas términos de error con media cero. Aquí, Mathy / matemáticas sólo se expresa en términos de sus valores pasados ​​y los valores actuales y pasados ​​de los términos de error. Este modelo se llama Moving autorregresivo integrado de media o mathARIMA (p, d, q) / modelo matemático de mathY. p / matemáticas es el número de valores retardados de Mathy / matemática que representa la naturaleza autorregresivo (AR) del modelo, mathq / matemáticas es el número de valores rezagados del término de error que representa la naturaleza de media móvil (MA) del modelo y mathd / matemáticas es el número de veces Mathy / matemáticas tiene que haber diferencias para producir el estacionaria Mathy / matemáticas. El término integrado implica que con el fin de obtener una previsión de Mathy / matemáticas. tenemos que resumir (o integrar más) los valores de Mathy / matemáticas porque Mathy / matemáticas son los valores diferenciados de la serie original Mathy. / Matemáticas Si no hay diferenciación está involucrado, este modelo se denomina autorregresivo de media móvil mathARMA (p, q) / matemáticas con mathp / matemáticas y mathq / matemáticas que conserva su significado original y sin mathd. / Matemáticas El término mathARIMA / o matemáticas mathARMA / matemáticas es muy confuso porque ambos, el Mathar / matemáticas y componentes / matemáticas mathMA tienen la misma forma matemática. Los dos son combinaciones lineales de los valores presentes y pasados ​​de variables aleatorias. El componente / matemáticas Mathar es la combinación lineal de los valores observables de Mathy / matemáticas mientras que el componente / matemáticas mathMA es la combinación lineal de los términos de perturbación de ruido blanco no observables. Esta es sólo una de esas trivialidades que se acostumbraría a con el tiempo. Económetras ignoró el enfoque Box-Jenkins al principio, pero se vieron obligados a prestar atención a ellos cuando se previsiones mathARIMA / matemáticas comenzaron superando consistentemente pronósticos basados ​​en modelos econométricos estándar. La falta de una teoría económica sólida detrás de la mathARIMA / matemáticas era preocupante para económetras a aceptar. Ellos respondieron mediante el desarrollo de otra clase de modelos que incorporan auroregressive y los componentes móviles del promedio de enfoque Box-Jenkins con el enfoque de variables explicativas de la econometría estándar. El más simple de estos modelos es el mathARIMAX / matemáticas que es sólo una mathARIMA / matemáticas con variables explicativas adicionales proporcionados por la teoría económica. Un mathARIMAX / matemática estándar debería ser escrita como, mathYbeta. X phi1Y phi2Y. phipY theta2epsilon epsilonttheta1epsilon. thetaqepsilon / matemáticas donde mathx / matemáticas puede ser cualquier variable económica. 3k Vistas middot Ver upvotes middot Not for Reproduction Echale un vistazo a este enlace: 8 ARIMA modelos OTexts Este es el capítulo dedicado a los modelos ARIMA de un fantástico libro de texto gratuito en línea sobre el pronóstico de series de tiempo desde el pedido Rob J Hyndman P de la parte autorregresiva . Ese es el número de términos desconocidos que multiplican su señal en tiempos pasados ​​(tantas veces pasadas como su valor p) el grado de diferenciación D de la primera cuestión. Número de veces que se tiene a la diferencia de su tiempo-serie para tener una orden uno Q estacionaria de la parte media móvil. Ese es el número de términos desconocidos que multiplican sus errores de pronóstico en tiempos pasados ​​(tantas veces pasadas como su valor q) Hay buenas técnicas para estimar los parámetros evaluados (en base a la autocorrelación - ACF - y las funciones de autocorrelación parcial - PACF): people. duke. edu/ y el proceso puede ser complejo y requiere mucho tiempo, aún más si tiene muchas series de tiempo para manejar con. En R hay una función llamada auto. arima en el paquete de previsión que evaluar todos estos parámetros de forma automática, incluso la parte estacionalidad (valores adicionales para el cálculo en caso de que haya estacionalidad en su serie de tiempo). 1.8K Vistas middot middot Ver upvotes excepto en modelos ARIMA y ReproductionARMA (Box-Jenkins) modelos ARMA y ARIMA (Box-Jenkins) En las secciones anteriores hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados ​​en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados ​​inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). En la práctica de una amplia gama de medidas (es decir, distinto de / además de las medidas de mínimos cuadrados basado, se puede utilizar para evaluar la calidad del modelo. Por ejemplo, el error absoluto medio y el error máximo absoluto pueden ser medidas útiles, ya que incluso una buenas ajuste de mínimos cuadrados todavía puede ser deficiente en algunos lugares. una serie de paquetes de software también puede proporcionar una medida global de la autocorrelación que pueda permanecer en los residuos después de ajustar el modelo. una estadística aplicada con frecuencia se debe a Ljung y Box (1978 LJU1) y es de la forma: donde n es el número de muestras (valores de datos), ri es la autocorrelación de la muestra en el retardo i y k es el número total de retardos sobre el que el cálculo se lleva a cabo Q k se distribuye aproximadamente como.. una distribución chi-cuadrado con k -. m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluir las variables constantes plazo o de predicción (es decir, justo incluyendo los pd q triples) Si la medida es estadísticamente significativa se indica que los residuos contienen todavía autocorrelación significativa después de que el modelo ha sido equipado, lo que sugiere que un modelo mejorado debe ser buscada. Ejemplo: Modelación del crecimiento del número de pasajeros de aerolíneas El siguiente es un ejemplo de montaje automatizada, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de aerolínea número de pasajeros REI1 han proporcionado anteriormente en este manual. Inicialmente se especifica ninguna especificación de las fechas que son meses dentro de unos años. El modelo seleccionado por el proceso automatizado era un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requiere un nivel de diferenciación y se aplica un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para adaptarse a la datos. El ajuste del modelo produjo un valor de R2 de 0,966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero la trama de la autocorrelación residual después del montaje y Ljung - Box prueba demuestra que sigue siendo autocorrelación significativa, lo que indica que un modelo mejorado es posible. Automatizado ARIMA ajuste a los pasajeros de avión Internacional: Los totales mensuales, 1949-1960 Para investigar más a fondo se ajustó un modelo revisado, basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) libro en que utiliza Minitab para ilustrar su análisis (6ª edición, 2003). Las series de tiempo se define como tener una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente los resultados son muy similares a la tabla de arriba, pero con este modelo, el R cuadrado es 0.991, el MAE41 y el estadístico de Ljung-Box ya no es significativa (12,6, con 16 grados de libertad). El modelo es así una mejora en la versión original (generado automáticamente), se compone de una MA no estacional y un componente MA estacional, ningún componente autorregresivo, y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea apropiado es manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para el modelado de una serie de tiempo, o puede ser que los modelos o enfoques alternativos proporcionan un resultado más satisfactorio. A menudo es difícil saber de antemano qué bueno es probable que sea ningún modelo de pronóstico dada, ya que es sólo a la luz de su capacidad para predecir valores futuros de la serie de datos que pueda ser verdaderamente juzgado. A menudo, este proceso se aproxima por el ajuste del modelo a los datos del pasado con exclusión de períodos de tiempo recientes (también conocidos como muestras de retención fuera) y, a continuación, utilizando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece confianza limitada en su validez futuro. el pronóstico a largo plazo puede ser extremadamente fiable utilización de dichos métodos. Es evidente que el modelo de las estadísticas de tráfico aéreo internacional se ha descrito anteriormente no es capaz de predecir correctamente los números de los pasajeros a través en la década de 1990 y más allá, ni la caída de 5 años en los Estados Unidos números internacionales de pasajeros de aerolíneas publicar 9/11/2001. Del mismo modo, un modelo ARIMA puede ser instalado en valores históricos de las cotizaciones bursátiles o valores de índice (por ejemplo, la Bolsa de Nueva York o de índices FTSE) y proporcionará típicamente un excelente ajuste a los datos (lo que da un valor de R cuadrado superior a 0,99), pero son a menudo de poca utilidad para la predicción de valores futuros de estos precios o índices. Típicamente, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y micro económico. Sin embargo, pueden ser aplicados en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables de predicción adicionales que se cree que mejora la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes en el tiempo, no en cualquier factores explicativos o causales. De ahí que los modelos ARIMA solamente reflejarán y extender los patrones del pasado, lo que podría ser necesario modificar las previsiones por factores tales como el entorno macroeconómico, los cambios tecnológicos, o de recursos a largo plazo y / o cambios ambientales. Box1 Box G E P, G Jenkins M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 caja, G E P, Jenkins, G M, G Reinsel C (1994) Análisis de series de tiempo, predicción y control. 3ª ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) El análisis de los tiempos de la serie: Teoría y Práctica. Chapman y Hall, Londres (véase también, 6ª ed., 2003) LJU1 Ljung G M, G E P Box (1978) sobre una medida de una falta de ajuste en modelos de series temporales. Biométrika, 65, 297303 NIST / SEMATECH e-Manual de Métodos Estadísticos, www. itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a las series temporales. 2010 SPSS / PASW 17 (2008) (modelos de series temporales) AnalyzeForecasting REI1 Reinsel GC conjuntos de datos para los modelos Box-Jenkins: www. stat. wisc. edu/Moving~~V modelos de promedio y suavizado exponencial Como un primer paso para ir más allá de los modelos de medias, paseo aleatorio modelos y modelos de tendencia lineal, los patrones y las tendencias no estacionales pueden ser extrapolados utilizando un modelo de media móvil o alisado. El supuesto básico detrás de promediado y modelos de suavizado es que la serie de tiempo es estacionaria localmente con una media de variación lenta. Por lo tanto, tomamos una media móvil (local) para estimar el valor actual de la media y luego usar eso como el pronóstico para el futuro próximo. Esto puede ser considerado como un compromiso entre el modelo de la media y la deriva en el modelo del paseo aleatorio, sin. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Un promedio móvil a menudo se llama una versión quotsmoothedquot de la serie original porque los promedios de corto plazo tiene el efecto de suavizar los baches en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), que podemos esperar para golpear algún tipo de equilibrio óptimo entre el rendimiento de los modelos de medias y caminar al azar. El tipo más simple de promedio de modelos es el. Sencilla (igualmente ponderados) Media Móvil: El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual a la media aritmética de las observaciones más recientes M: (Aquí y en otros lugares que va a utilizar el símbolo 8220Y-hat8221 reposar para obtener la previsión de las series temporales Y hecha en la fecha previa temprano posible de un modelo dado.) Este promedio se centra en el periodo t (m1) / 2, lo que implica que la estimación de la media local tenderá a la zaga del verdadero valor de la media local por cerca de (m1) / 2 períodos. Por lo tanto, decimos que la edad promedio de los datos de la media móvil simple (m1) / 2 con respecto al período para el que se calcula el pronóstico: esta es la cantidad de tiempo en que las previsiones tienden a la zaga de los puntos de inflexión en el datos. Por ejemplo, si son un promedio de los últimos 5 valores, las previsiones será de unos 3 periodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de paseo aleatorio (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo de SMA es equivalente al modelo de la media. Como con cualquier parámetro de un modelo de predicción, es costumbre para ajustar el valor de k con el fin de obtener el mejor quotfitquot a los datos, es decir, los errores de pronóstico más pequeños en promedio. Aquí está un ejemplo de una serie que parece mostrar fluctuaciones aleatorias alrededor de una media que varía lentamente. En primer lugar, permite tratar de encajar con un modelo de paseo aleatorio, lo que equivale a una media móvil simple de 1 plazo: El modelo de paseo aleatorio responde muy rápidamente a los cambios en la serie, pero al hacerlo se recoge gran parte de la quotnoisequot en el datos (las fluctuaciones aleatorias), así como la quotsignalquot (la media local). Si en lugar de probar una media móvil simple de 5 términos, obtenemos una puesta a punto más suave en busca de los pronósticos: El 5 plazo promedio móvil simple rendimientos significativamente más pequeños que los errores del modelo de paseo aleatorio en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, una recesión parece haber ocurrido en el período de 21 años, pero las previsiones no dar la vuelta hasta varios períodos más tarde.) Tenga en cuenta que las previsiones a largo plazo del modelo de SMA son una línea recta horizontal, al igual que en el paseo aleatorio modelo. Por lo tanto, el modelo de SMA asume que no hay una tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de paseo aleatorio son simplemente igual al último valor observado, las predicciones del modelo de SMA son iguales a una media ponderada de los valores recientes. Los límites de confianza calculados por Statgraphics para las previsiones a largo plazo de la media móvil simple no se ensanchan a medida que aumenta la previsión horizonte. Esto obviamente no es correcta Desafortunadamente, no existe una teoría estadística subyacente que nos dice cómo los intervalos de confianza debe ampliar para este modelo. Sin embargo, no es demasiado difícil de calcular estimaciones empíricas de los límites de confianza para los pronósticos a más largo horizonte. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo de SMA sería utilizado para pronosticar 2 pasos por delante, 3 pasos por delante, etc., dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de la muestra de los errores en cada horizonte de pronóstico, y luego construir intervalos de confianza para los pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar correspondiente. Si tratamos una media móvil simple de 9 plazo, obtenemos previsiones aún más suaves y más de un efecto rezagado: La edad media es ahora de 5 puntos ((91) / 2). Si tomamos una media móvil de 19 plazo, el promedio de edad aumenta a 10: Tenga en cuenta que, de hecho, las previsiones están quedando atrás los puntos de inflexión en alrededor de 10 periodos. ¿Qué cantidad de suavizado que es mejor para esta serie Aquí se presenta una tabla que compara sus estadísticas de errores, incluyendo también una 3-plazo promedio: Modelo C, la media móvil de 5 plazo, se obtiene el valor más bajo de RMSE por un pequeño margen sobre el 3 - term y 9 plazo promedios, y sus otras estadísticas son casi idénticos. Así, entre los modelos con las estadísticas de errores muy similares, podemos elegir si preferimos un poco más la capacidad de respuesta o un poco más de suavidad en los pronósticos. (Volver al comienzo de la página.) Browns suavizado exponencial simple (promedio móvil ponderado exponencialmente) El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable que trata los últimos k observaciones por igual y completamente ignora todas las observaciones precedentes. Intuitivamente, los datos del pasado deben ser descontados de forma más gradual - por ejemplo, la observación más reciente debería ser un poco más de peso que 2 más reciente, y el segundo más reciente debería ser un poco más peso que la 3 más reciente, y pronto. El modelo de suavizamiento exponencial simple (SES) logra esto. Vamos a 945 denotan un constantquot quotsmoothing (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que representa el nivel actual (es decir, valor medio local) de la serie como se estima a partir de datos hasta el presente. El valor de L en el tiempo t se calcula de forma recursiva a partir de su propio valor anterior así: Por lo tanto, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde los 945 controles de la proximidad entre el valor interpolado a la más reciente observación. La previsión para el próximo período es simplemente el valor suavizado actual: De manera equivalente, podemos expresar el pronóstico siguiente directamente en función de las previsiones anteriores y observaciones anteriores, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre pronóstico anterior y observación anterior: En la segunda versión, el siguiente pronóstico se obtiene mediante el ajuste de la previsión anterior en la dirección del error anterior por una cantidad fraccionaria 945. está el error cometido en el tiempo t. En la tercera versión, el pronóstico es un ponderado exponencialmente (es decir, descontado) de media móvil con el factor de descuento 1- 945: La versión de interpolación de la fórmula de predicción es el más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en una sola célula y contiene referencias a celdas que apuntan a la previsión anterior, la observación anterior, y la célula donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de paseo aleatorio (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo de la media, suponiendo que el primer valor de suavizado se establece igual a la media. (Volver al comienzo de la página.) La edad promedio de los datos en el pronóstico a simple alisado exponencial es 1/945 con respecto al período para el que se calcula el pronóstico. (Esto no se supone que es obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el simple previsión de media móvil tiende a la zaga de los puntos de inflexión en alrededor de 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es de 2 945 periodos en los que el retraso es 0,2 5 0,1 945 periodos en los que el retraso es de 10 períodos, y así sucesivamente. Para una edad media determinada (es decir, cantidad de lag), el suavizamiento exponencial simple (SES) Pronóstico es algo superior a la previsión media móvil simple (SMA) porque pone relativamente más peso en la más reciente --i. e observación. es ligeramente más quotresponsivequot a los cambios que ocurren en el pasado reciente. Por ejemplo, un modelo de SMA con 9 términos y un modelo de SES con 945 0.2 ambos tienen una edad promedio de 5 para los datos en sus previsiones, pero el modelo SES pone más peso en los últimos 3 valores que lo hace el modelo de SMA y en el mismo tiempo doesn8217t totalmente 8220forget8221 sobre los valores de más de 9 períodos de edad, como se muestra en esta tabla: Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es continuamente variable, por lo que puede fácilmente optimizada mediante el uso de un algoritmo de quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES para esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 periodos, que es similar a la de un móvil simple 6 plazo promedio. Las previsiones a largo plazo del modelo de SES son una línea recta horizontal. como en el modelo de SMA y el modelo de paseo aleatorio sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de un modo de aspecto razonable, y que son sustancialmente más estrecha que los intervalos de confianza para el modelo de paseo aleatorio. El modelo SES asume que la serie es un poco predictablequot quotmore que lo hace el modelo de paseo aleatorio. Un modelo SES es en realidad un caso especial de un modelo ARIMA. por lo que la teoría estadística de los modelos ARIMA proporciona una buena base para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un MA (1) plazo, y sin término constante. también conocido como un modelo quotARIMA (0,1,1) sin constantquot. El MA (1) coeficiente en el modelo ARIMA corresponde a la cantidad 1- 945 en el modelo de SES. Por ejemplo, si encaja en un modelo ARIMA (0,1,1) sin el temor constante a la serie analizada aquí, el MA estimado (1) coeficiente resulta ser 0.7029, que es casi exactamente uno menos 0,2961. Es posible añadir el supuesto de un no-cero tendencia constante lineal a un modelo de SES. Para ello, sólo tiene que especificar un modelo ARIMA con una diferencia no estacional y un (1) término MA con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia promedio observado durante todo el período de estimación. No se puede hacer esto en conjunto con ajuste estacional, ya que las opciones de ajuste estacional se desactivan cuando el tipo de modelo se establece en ARIMA. Sin embargo, se puede añadir una tendencia exponencial constante a largo plazo a un simple modelo de suavizado exponencial (con o sin ajuste estacional) mediante el uso de la opción de ajuste de la inflación en el procedimiento de pronóstico. La tasa de quotinflationquot apropiado (porcentaje de crecimiento) por período se puede calcular como el coeficiente de la pendiente en un modelo de tendencia lineal ajustada a los datos en conjunción con una transformación logaritmo natural, o puede basarse en otra información, independiente sobre las perspectivas de crecimiento a largo plazo . (Volver a la parte superior de la página.) Browns lineales (es decir, dobles) modelos de suavizado exponencial de la media móvil y modelos SES asumen que no hay una tendencia de cualquier tipo en los datos (que es por lo general OK o al menos no muy malo para 1- previsiones paso por delante cuando los datos son relativamente ruidoso), y que pueden ser modificados para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué hay de tendencias a corto plazo Si una serie muestra una tasa variable de crecimiento o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de 1 periodo por delante, a continuación, la estimación de una tendencia local también puede ser un problema. El modelo simple de suavizado exponencial se puede generalizar para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de tanto nivel y la tendencia. El modelo de tendencia variable en el tiempo más simple es Browns lineales exponencial modelo de suavizado, que utiliza dos series diferentes alisado que se centran en diferentes puntos en el tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación.) La forma algebraica de Brown8217s lineal modelo de suavizado exponencial, al igual que la del modelo simple de suavizado exponencial, se puede expresar en un número de formas diferentes pero equivalentes. La forma quotstandardquot de este modelo se suele expresar como sigue: Sea S la serie suavizada por enlaces sencillos, obtenido mediante la aplicación de suavizado exponencial simple de la serie Y. Es decir, el valor de S en el período t viene dada por: (Hay que recordar que, en virtud de simples suavizado exponencial, esto sería el pronóstico para Y en el periodo t1), entonces Squot denotan la serie suavizada doblemente obtenido mediante la aplicación de suavizado exponencial simple (utilizando la misma 945) de la serie S:. por último, el pronóstico para tk Y. para cualquier kgt1, viene dada por: Esto produce e 1 0 (es decir, engañar un poco, y dejar que el primer pronóstico es igual a la primera observación real), y e 2 Y2 Y1 8211. después de lo cual las previsiones se generan utilizando la ecuación anterior. Esto produce los mismos valores ajustados según la fórmula basada en S y S si éstas se puso en marcha el uso de S 1 S 1 Y 1. Esta versión del modelo se utiliza en la siguiente página que ilustra una combinación de suavizado exponencial con ajuste estacional. modelo Holt8217s lineal de suavizado exponencial Brown8217s LES calcula estimaciones locales de nivel y la tendencia al suavizar los datos recientes, pero el hecho de que lo hace con un único parámetro de suavizado un factor limitante para los patrones de datos que es capaz de encajar: el nivel y la tendencia no se les permite variar a frecuencias independientes. modelo Holt8217s LES resuelve este problema mediante la inclusión de dos constantes de suavizado, una para el nivel y uno para la tendencia. En cualquier momento t, como en el modelo Brown8217s, el no es una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se computan de forma recursiva a partir del valor de Y observó en el tiempo t, y las estimaciones anteriores del nivel y la tendencia por dos ecuaciones que se aplican suavizado exponencial a ellos por separado. Si el nivel estimado y la tendencia en el tiempo t-1 son L y T t82091 t-1. respectivamente, entonces el pronóstico para Y tshy que se habrían hecho en el momento t-1 es igual a L-1 t t t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula de forma recursiva mediante la interpolación entre Y tshy y su pronóstico, L-1 t t t-1, usando pesos de 945 y 945. 1- El cambio en el nivel estimado, es decir, L t L 8209 t82091. puede interpretarse como una medición de ruido de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula entonces de forma recursiva mediante la interpolación entre L T 8209 L t82091 y la estimación anterior de la tendencia, T t-1. usando pesos de 946 y 1-946: La interpretación de la tendencia constante de alisamiento 946 es análoga a la de los de nivel constante de alisamiento 945. Los modelos con valores pequeños de 946 asume que la tendencia cambia sólo muy lentamente con el tiempo, mientras que los modelos con 946 más grande asumen que está cambiando más rápidamente. Un modelo con un gran 946 cree que el futuro lejano es muy incierto, ya que los errores en la estimación de la tendencia-llegar a ser bastante importante cuando la previsión de más de un período que se avecina. (Volver al principio de la página.) El suavizado constantes de 945 y 946 se puede estimar de la forma habitual mediante la minimización del error cuadrático medio de las previsiones 1-paso-a continuación. Cuando esto se haga en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0.008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período a otro, por lo que, básicamente, este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de que la edad promedio de los datos que se utiliza para estimar el nivel local de la serie, la edad media de los datos que se utiliza para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso que resulta ser 1 / 0.006 125. Esta isn8217t un número muy preciso ya que la precisión de la estimación de 946 isn8217t realmente 3 cifras decimales, pero es del mismo orden general de magnitud que el tamaño de muestra de 100 , por lo que este modelo tiene un promedio de más de un buen montón de historia para estimar la tendencia. La trama de previsión a continuación muestra que el modelo de LES estima una tendencia local de un poco más grande en el extremo de la serie de la tendencia constante estimado en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntica a la obtenida ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, hacen éstos se parecen a las previsiones razonables para un modelo que se supone que es la estimación de la tendencia local Si 8220eyeball8221 esta trama, parece que la tendencia local se ha convertido a la baja al final de la serie Lo que ha sucedido Los parámetros de este modelo se han estimado mediante la minimización del error al cuadrado de las previsiones de 1-paso adelante, no pronósticos a más largo plazo, en cuyo caso la tendencia doesn8217t hacen una gran diferencia. Si todo lo que está viendo son los errores 1-paso-a continuación, usted no está viendo el panorama general de las tendencias en (digamos) 10 o 20 períodos. Con el fin de conseguir este modelo más acorde con nuestra extrapolación de los datos de globo ocular, podemos ajustar manualmente la tendencia constante de alisamiento para que utilice una línea de base más corta para la estimación de tendencia. Por ejemplo, si elegimos para establecer 946 0.1, a continuación, la edad media de los datos utilizados en la estimación de la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia de que los últimos 20 períodos más o menos. Here8217s lo que la trama de previsión parece si ponemos 946 0,1 945 0,3 mientras se mantiene. Esto parece intuitivamente razonable para esta serie, aunque es probable que sea peligroso extrapolar esta tendencia alguna más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de error Aquí está una comparación de modelos para los dos modelos que se muestran arriba, así como tres modelos SES. El valor óptimo de 945.para el modelo SES es de aproximadamente 0,3, pero resultados similares (con poco más o menos capacidad de respuesta, respectivamente) se obtienen con 0,5 y 0,2. exp lineal (A) Holt. suavizado con alfa y beta 0,3048 0,008 (B) Holts exp lineal. suavizado con alfa 0,3 y beta 0.1 (C) de suavizado exponencial simple con alfa 0,5 (D) de suavizado exponencial simple con alfa 0,3 (E) de suavizado exponencial simple con alfa 0,2 Sus estadísticas son casi idénticos, por lo que realmente can8217t tomar la decisión sobre la base de los errores de pronóstico 1 paso por delante dentro de la muestra de datos. Tenemos que recurrir a otras consideraciones. Si estamos convencidos de que tiene sentido basar la estimación actual tendencia en lo que ha ocurrido en los últimos 20 períodos más o menos, podemos hacer un caso para el modelo con LES y 945 0,3 946 0,1. Si queremos ser agnóstico sobre si existe una tendencia local, entonces uno de los modelos SLS podría ser más fácil de explicar y también daría más pronósticos media-of-the-road para los próximos 5 o 10 períodos. (Volver al principio de la página.) ¿Qué tipo de tendencia-extrapolación es mejor: La evidencia empírica horizontal o lineal sugiere que, si ya se han ajustado los datos (si es necesario) para la inflación, entonces puede ser imprudente extrapolar lineal a corto plazo tendencias muy lejos en el futuro. Tendencias hoy evidentes podrían crecer más en el futuro debido a causas variadas como la obsolescencia de los productos, el aumento de la competencia, y las depresiones cíclicas o repuntes en una industria. Por esta razón, suavizamiento exponencial simple menudo funciona mejor fuera de la muestra de lo que se podría esperar de otro modo, a pesar de su quotnaivequot horizontal extrapolación de tendencias. Amortiguadas modificaciones tendencia del modelo de suavizado exponencial lineal también se utilizan a menudo en la práctica de introducir una nota de cautela en sus proyecciones de tendencias. El modelo LES-tendencia amortiguada puede ser implementado como un caso especial de un modelo ARIMA, en particular, una (1,1,2) modelo ARIMA. Es posible calcular intervalos de confianza alrededor de las predicciones a largo plazo producidos por los modelos de suavizado exponencial, al considerarlos como casos especiales de los modelos ARIMA. (Cuidado: no todo el software calcula correctamente los intervalos de confianza para estos modelos.) La anchura de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (s) de la constante (s) de suavizado y (iv) el número de períodos por delante que se pronostica. En general, los intervalos se extienden más rápido a medida 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se utiliza en lugar de lineal de suavizado simple. En este tema se tratará más adelante en la sección de modelos ARIMA de las notas. (Volver al comienzo de la página.)


No comments:

Post a Comment