Tengo un valor continuo para el cual Id desea calcular una media móvil exponencial. Normalmente Id simplemente usa la fórmula estándar para esto: donde S n es el nuevo promedio, alfa es el alfa, Y es la muestra, y S n-1 es el promedio anterior. Por desgracia, debido a varios problemas que no tienen un tiempo de muestra consistente. Puedo saber que puedo probar como máximo, digamos, una vez por milisegundo, pero debido a factores fuera de mi control, es posible que no pueda tomar una muestra durante varios milisegundos a la vez. Un caso más probable, sin embargo, es que la simple muestra un poco temprano o tarde: en lugar de muestreo a 0, 1 y 2 ms. Muestra a 0, 0,9 y 2,1 ms. Yo anticipo que, independientemente de los retrasos, mi frecuencia de muestreo estará muy, muy por encima del límite de Nyquist, y por lo tanto no necesito preocuparme por aliasing. Creo que puedo lidiar con esto de una manera más o menos razonable variando el alfa apropiadamente, basado en el tiempo transcurrido desde la última muestra. Parte de mi razonamiento de que esto funcionará es que la EMA interpola linealmente entre el punto de datos anterior y el actual. Si consideramos el cálculo de una EMA de la siguiente lista de muestras a intervalos t: 0,1,2,3,4. Deberíamos obtener el mismo resultado si usamos el intervalo 2t, donde los insumos se vuelven 0,2,4, a la derecha. Si la EMA hubiera asumido que, en t 2, el valor había sido 2 desde t0. Que sería el mismo que el cálculo del intervalo t cálculo en 0,2,2,4,4, lo que no lo hace. ¿O es que tiene sentido en absoluto ¿Puede alguien decirme cómo variar el alfa adecuadamente Por favor, muestre su trabajo. Es decir. Muéstrame las matemáticas que demuestran que tu método realmente está haciendo lo correcto. No deberías obtener el mismo EMA para diferentes entradas. Piense en EMA como un filtro, el muestreo en 2t es equivalente a muestreo hacia abajo, y el filtro va a dar una salida diferente. Esto es claro para mí ya que 0,2,4 contiene componentes de frecuencia más alta que 0,1,2,3,4. A menos que la pregunta es, ¿cómo puedo cambiar el filtro sobre la marcha para hacer que dar la misma salida. Tal vez estoy perdiendo algo ndash freespace Jun 21 09 at 15:52 Pero la entrada no es diferente, it39s muestra sólo menos a menudo. 0,2,4 a intervalos 2t es como 0,, 2, 4 en los intervalos t, donde indica que la muestra es ignorada ndash Curt Sampson Jun 21 09 at 23:45 Esta respuesta basada en mi buena comprensión del paso bajo Filtros (media móvil exponencial es realmente sólo un filtro de paso simple de un solo polo), pero mi comprensión nebulosa de lo que estás buscando. Creo que lo siguiente es lo que quieres: Primero, puedes simplificar tu ecuación un poco (parece más complicado pero es más fácil en código). Im que va a utilizar Y para la salida y X para la entrada (en vez de S para la salida y Y para la entrada, como usted ha hecho). En segundo lugar, el valor de alpha aquí es igual a 1-e-Datat / tau donde Deltat es el tiempo entre muestras, y tau es la constante de tiempo del filtro de paso bajo. Digo igual entre comillas porque esto funciona bien cuando Deltat / tau es pequeño comparado con 1, y alpha 1-e-Datat / tau asymp Deltat / tau. (Pero no demasiado pequeño: se ejecuta en cuestiones de cuantificación, ya menos que recurrir a algunas técnicas exóticas que por lo general necesitan un N bits adicionales de resolución en su estado variable S, donde N - log 2 (alfa).) Para valores más grandes de Deltat / Tau el efecto de filtrado comienza a desaparecer, hasta llegar al punto en que el alfa está cerca de 1 y básicamente sólo se asigna la entrada a la salida. Esto debería funcionar correctamente con diferentes valores de Deltat (la variación de Deltat no es muy importante, siempre y cuando el alfa sea pequeño, de lo contrario se encontrará con algunos problemas más extraños de Nyquist / aliasing / etc.), y si está trabajando en un procesador Donde la multiplicación es más barata que la división, o cuestiones de punto fijo son importantes, precalculate omega 1 / tau, y considere tratar de aproximar la fórmula de alfa. Si realmente quiere saber cómo derivar la fórmula alfa 1-e-Datat / tau, considere su fuente de ecuaciones diferenciales: cuando X es una función de escalón unitario, tiene la solución Y 1 - e - t / tau. Para valores pequeños de Deltat, la derivada puede ser aproximada por DeltaY / Deltat, produciendo Y tau DeltaY / Deltat X DeltaY (XY) (Deltat / tau) alfa (XY) y la extrapolación de alfa 1-e - Detat / tau proviene de Tratando de igualar el comportamiento con el caso de función de paso de unidad. ¿Podría por favor elaborar en el quottrying para coincidir con la parte de comportamiento que entiendo su solución de tiempo continuo Y 1 - exp (-t47) y su generalización a una función escalonada de escalón con magnitud xy condición inicial y (0). Pero no veo cómo juntar estas ideas para lograr su resultado. Ndash Rhys Ulerich May 4 13 at 22:34 Esta no es una respuesta completa, pero puede ser el comienzo de uno. Es tan lejos como llegué con esto en una hora o así de jugar Im publicarlo como un ejemplo de lo que estoy buscando, y tal vez una inspiración para otros que trabajan en el problema. Empiezo con S 0. Que es el promedio resultante del promedio anterior S -1 y la muestra Y 0 tomada en t 0. (T 1 - t 0) es mi intervalo de muestreo y alfa se ajusta a lo que sea apropiado para ese intervalo de muestra y el período sobre el cual deseo mediar. He considerado lo que sucede si me pierdo la muestra en t 1 y en su lugar tienen que conformarse con la muestra Y 2 tomada en t 2. Pues bien, podemos comenzar expandiendo la ecuación para ver lo que habría pasado si hubiéramos tenido Y 1: Observo que la serie parece extenderse infinitamente de esta manera, porque podemos sustituir indefinidamente el S n en el lado derecho: Ok , Por lo que no es realmente un polinomio (tonto yo), pero si multiplicamos el término inicial por uno, entonces vemos un patrón: Hm: es una serie exponencial. Quelle sorpresa Imagina que saliendo de la ecuación para una media móvil exponencial Así que de todos modos, tengo esta x 0 x 1 x 2 x 3. Cosa que va, y estoy seguro de que estoy oliendo e o un logaritmo natural dando patadas por aquí, pero no puedo recordar donde me dirigía después antes de que me quedé sin tiempo. Cualquier respuesta a esta pregunta, o cualquier prueba de corrección de tal respuesta, depende altamente de los datos que usted está midiendo. Si sus muestras se tomaron en t 0 0ms. T _ {1} 0,9ms y t _ {2} 2,1ms. Pero su elección de alfa se basa en intervalos de 1 ms, y por lo tanto desea un alpha n ajustado localmente. La prueba de corrección de la elección significaría conocer los valores de la muestra en t1ms y t2ms. Esto conduce a la pregunta: ¿Puede usted interpolar sus datos resonably para tener sanas suposiciones de qué valores intermedios pudo haber sido? ¿O usted puede incluso interpolar el promedio sí mismo? Si ninguno de éstos es posible, entonces por lo que yo lo veo, el lógico La elección de un valor intermedio Y (t) es el promedio calculado más recientemente. Es decir, Y (t) asımpona S n en la que n es maxmial tal que t n ltt. Esta elección tiene una consecuencia simple: Dejar alfa solo, no importa cuál era la diferencia de tiempo. Si, por otro lado, es posible interpolar sus valores, entonces esto le dará muestras de intervalo constante promedio. Por último, si es posible interpolar el promedio mismo, eso haría la pregunta sin sentido. Respondió Jun 21 09 at 15:08 balpha 9830 26.1k 9679 9 9679 84 9679 116 Creo que puedo interpolar mis datos: dado que I39m muestreo a intervalos discretos, I39m ya hacerlo con una EMA estándar De todos modos, asumir que necesito Un quotproofquot que muestra que funciona tan bien como un estándar EMA, que también tiene producirá un resultado incorrecto si los valores no están cambiando bastante suavemente entre períodos de muestra. Ndash Curt Sampson Jun 21 09 at 15:21 Pero eso es lo que estoy diciendo: Si consideras a la EMA una interpolación de tus valores, lo harás si dejas alfa tal cual (porque insertar el promedio más reciente como Y no cambia el promedio) . Si usted dice que necesita algo que funciona igual que un EMA estándar - lo que está mal con el original A menos que tenga más información acerca de los datos que está midiendo, cualquier ajuste local alfa será arbitrario. Ndash balpha 9830 Jun 21 09 at 15:31 Me gustaría dejar el valor de alpha solo, y rellenar los datos faltantes. Puesto que usted no sabe qué sucede durante el tiempo en que usted no puede probar, usted puede llenar esas muestras con 0s, o mantener el valor anterior estable y utilizar esos valores para el EMA. O una interpolación hacia atrás una vez que tenga una nueva muestra, rellene los valores faltantes y vuelva a calcular la EMA. Lo que estoy tratando de obtener es que tiene una entrada xn que tiene agujeros. No hay forma de evitar el hecho de que faltan datos. Por lo tanto, puede utilizar una retención de orden cero, o establecerla en cero, o algún tipo de interpolación entre xn y xnM. Donde M es el número de muestras faltantes y n el inicio de la brecha. Posiblemente incluso usando valores antes de n. De gastar una hora o así que mucking sobre un pedacito con la matemáticas para esto, pienso que el variar simplemente el alfa me dará realmente la interpolación apropiada entre los dos puntos que usted habla, pero en un Mucho más sencillo. Además, creo que la variación del alfa también tratará adecuadamente con las muestras tomadas entre los intervalos de muestreo estándar. En otras palabras, busco lo que describiste, pero tratando de usar las matemáticas para averiguar la forma sencilla de hacerlo. Ndash Curt Sampson Jun 21 09 at 14:07 No creo que haya una bestia como la interpolación quotproper. Simplemente no sabes lo que pasó en el momento en que no estás tomando muestras. Buena y mala interpolación implica algún conocimiento de lo que te perdiste, ya que tienes que medir en contra de eso para juzgar si una interpolación es buena o mala. A pesar de que dicho, usted puede colocar las limitaciones, es decir, con la aceleración máxima, velocidad, etc Creo que si usted sabe cómo modelar los datos que faltan, entonces sólo modelar los datos que faltan, a continuación, aplicar el algoritmo EMA sin cambio, más bien Que cambiar alfa. Just my 2c :) ndash freespace Jun 21 09 at 14:17 Esto es exactamente lo que estaba recibiendo en mi edición de la pregunta hace 15 minutos: quotYou simplemente don39t saber lo que pasó en el tiempo que no están muestreo, pero eso es cierto Incluso si usted muestra en cada intervalo designado. Así mi contemplación de Nyquist: mientras sepas que la forma de la onda no cambia las direcciones más que cada par de muestras, el intervalo real de la muestra no debería importar, y debería ser capaz de variar. La ecuación de EMA me parece exactamente para calcular como si la forma de onda cambió linealmente del último valor de la muestra al actual. Ndash Curt Sampson Jun 21 09 at 14:26 No creo que eso sea cierto. El teorema de Nyquist requiere un mínimo de 2 muestras por período para poder identificar de manera única la señal. Si no lo hace, obtendrá aliasing. Sería lo mismo que muestrear como fs1 durante un tiempo, luego fs2, luego volver a fs1, y obtendrá aliasing en los datos cuando se muestre con fs2 si fs2 está por debajo del límite de Nyquist. También debo confesar que no entiendo lo que quieres decir con cambios de quotwaveform linealmente de la última muestra a la actual onequot. ¿Podría por favor explicar Cheers, Steve. Ndash freespace Jun 21 09 at 14:36 Esto es similar a un problema abierto en mi lista de tareas. Tengo un esquema elaborado en cierta medida, pero no tienen trabajo matemático para respaldar esta sugerencia todavía. Actualizar el resumen de amplificador: Quisiera mantener el factor de suavizado (alfa) independiente del factor de compensación (que me refiero como beta aquí). Jasons excelente respuesta ya aceptada aquí funciona muy bien para mí. Si también se puede medir el tiempo transcurrido desde la última muestra (en múltiplos redondeados de su tiempo de muestreo constante - 7,8 ms desde la última muestra sería de 8 unidades), que podría ser utilizado para aplicar el suavizado varias veces. Aplicar la fórmula 8 veces en este caso. Usted ha hecho efectivamente un suavizado más inclinado hacia el valor actual. Para obtener un mejor suavizado, tenemos que ajustar el alfa al aplicar la fórmula 8 veces en el caso anterior. ¿Qué va a faltar esta aproximación de suavizado? Ya ha perdido 7 muestras en el ejemplo anterior Esto se aproximó en el paso 1 con una aplastada re-aplicación del valor actual un adicional de 7 veces Si definimos un factor de aproximación beta que se aplicará junto con alfa (Como alphabeta en lugar de sólo alfa), vamos a suponer que las 7 muestras perdidas estaban cambiando suavemente entre los valores de la muestra anterior y actual. Yo pensé en esto, pero un poco de mierda con las matemáticas me llevó al punto en el que creo que, en lugar de aplicar la fórmula ocho veces con el valor de la muestra, puedo hacer un cálculo De un nuevo alfa que me permitirá aplicar la fórmula una vez, y me dará el mismo resultado. Además, esto se ocuparía automáticamente de la cuestión de las muestras contrarrestadas por los tiempos de muestreo exactos. Ndash Curt Sampson Jun 21 09 at 13:47 La única solicitud está bien. Lo que no estoy seguro todavía es cómo es buena la aproximación de los 7 valores perdidos. Si el movimiento continuo hace que el valor de la fluctuación de fase a través de los 8 milisegundos, las aproximaciones pueden ser bastante fuera de la realidad. Pero, si usted está muestreando en 1ms (resolución más alta excluyendo las muestras retrasadas) ya ha calculado que el fluctuaciones dentro de 1 ms no es relevante. ¿Este razonamiento funciona para usted (todavía estoy tratando de convencer a mí mismo). Ndash nik Jun 21 09 at 14:08 Derecho. Ese es el factor beta de mi descripción. Un factor beta se calcularía sobre la base del intervalo de diferencia y de las muestras actuales y anteriores. El nuevo alfa será (alfabeto), pero se utilizará sólo para esa muestra. Mientras que usted parece ser el alfa en la fórmula, tienden hacia alfa constante (factor de suavizado) y una beta independientemente calculada (un factor de ajuste) que compensa las muestras faltadas apenas ahora. Ndash nik Jun 21 09 at 15: 23Alguna lectura de fin de semana para los seguidores de tendencias que quieren cuestionar sus creencias. Valeriy Zakamulin es un animal cuando se trata de generar investigación sobre promedios móviles. Hemos hecho mucho del mismo trabajo, pero es demasiado perezoso para tabular los resultados en un formato de papel académico. Revisión de la rentabilidad de la oportunidad de mercado con los promedios móviles En un reciente estudio empírico realizado por Glabadanidis, el periódico también está disponible en inglés. Disponible en la SSRN y se ha descargado más de 7.500 veces), el autor de informes evidencia sorprendente de buen desempeño extraordinario de la estrategia de media móvil de comercio. En este artículo demostramos que el buen desempeño de la estrategia del promedio móvil se debe a la simulación del comercio con el sesgo prospectivo. Realizamos las simulaciones sin sesgo prospectivo e informamos sobre el verdadero desempeño de la estrategia del promedio móvil. En el mejor de los casos, el desempeño de la estrategia de media móvil es sólo marginalmente mejor que el de la correspondiente estrategia de compra y retención. En términos estadísticos, el desempeño de la estrategia del promedio móvil es indistinguible del desempeño de la estrategia de compra y retención. Este documento se suministra con código R que permite a cada lector interesado reproducir los resultados reportados. A pesar del enorme interés actual en el mercado de tiempo y una serie de publicaciones en revistas académicas, todavía hay falta de investigación exhaustiva sobre la evaluación de la rentabilidad de la negociación Reglas que usan métodos que están libres del sesgo de snooping de datos. En este artículo utilizamos el conjunto de datos histórico más largo que abarca 155 años y ampliamos los estudios previos sobre el desempeño de las reglas de negociación promedio móvil de varias maneras importantes. Entre otras cosas, investigamos si la sobreponderación de los precios recientes mejora el desempeño de las reglas de tiempo si existe un período óptimo de retroceso óptimo en cada regla de negociación y con qué precisión las reglas de negociación identifican las tendencias alcistas y bajistas del mercado de valores. En nuestro estudio utilizamos por primera vez el esquema de estimación de la ventana de balanceo y expansión en el estudio de las pruebas fuera de la muestra, el desempeño de las reglas de comercio en los mercados alcista y alcista y realizamos numerosos controles de robustez y pruebas para los cambios de régimen En la dinámica del mercado de valores. Nuestros principales resultados pueden resumirse de la siguiente manera: Existe una fuerte evidencia de que la dinámica del mercado bursátil está cambiando con el tiempo. No encontramos ninguna evidencia estadísticamente significativa de que las estrategias de market timing hayan superado al mercado en la segunda mitad de nuestra muestra. Ni la forma de la función de ponderación ni el tipo de esquema de estimación fuera de la muestra permiten a un comerciante mejorar el rendimiento de las reglas de temporización. Todas las reglas de tiempo de mercado generan muchas señales falsas durante las tendencias alcistas y bajistas del mercado de valores, sin embargo, estas reglas tienden a superar al mercado en los estados de oso. Valeriy Zakamulin, documento de trabajo En este artículo nos entretienen un método para encontrar el esquema de ponderación de la media móvil más robusta para utilizar con el propósito de sincronizar el mercado. La robustez de un esquema de ponderación define su capacidad para generar un desempeño sostenible bajo todos los posibles escenarios de mercado, independientemente del tamaño de la ventana de promedio. El método se ilustra utilizando los datos históricos a largo plazo sobre el índice de precios de las acciones Standard y Poor8217s. Encontramos el esquema de ponderación promedio móvil más sólido, demuestra sus ventajas y discutimos su implementación práctica. Anatomía del tiempo de mercado con promedios móviles Valeriy Zakamulin, documento de trabajo El concepto subyacente detrás de los indicadores comerciales comerciales basados en las medias móviles de los precios ha permanecido inalterado por más de la mitad de un siglo. El desarrollo en este campo ha consistido en proponer nuevas reglas ad hoc y utilizar tipos más elaborados de promedios móviles en las reglas existentes, sin un análisis más profundo de las coincidencias y diferencias entre las diversas opciones para las reglas comerciales y las medias móviles. En este artículo descubrimos la anatomía de las reglas de tiempo de mercado con medias móviles. Nuestro análisis ofrece una nueva y muy perspicaz reinterpretación de las normas existentes y demuestra que el cálculo de cada indicador de negociación puede interpretarse de manera equivalente como el cálculo de la media móvil ponderada de las variaciones de precios. Este conocimiento permite a un comerciante entender claramente las características de respuesta de los indicadores comerciales y simplificar dramáticamente la búsqueda de la mejor regla comercial. Como una aplicación directa de los conocimientos útiles revelados por nuestro análisis, en este documento también entretenemos un método para encontrar el más robusto promedio móvil ponderación esquema. El método se ilustra utilizando los datos históricos a largo plazo sobre el índice de precios de las acciones Standard y Poor8217s. Encontramos el esquema de ponderación media móvil más robusto y demuestra sus ventajas. Únase a miles de otros lectores y suscríbase a nuestro blog. Recuerde que el desempeño pasado no es un indicador de resultados futuros. Por favor, lea nuestro aviso legal completo. Las opiniones y opiniones expresadas aquí son las del autor y no necesariamente reflejan las opiniones de Alpha Architect, sus afiliados o sus empleados. Este material se le ha proporcionado únicamente con fines informativos y educativos y no constituye una oferta o solicitud de una oferta o ningún consejo o recomendación para comprar valores u otros instrumentos financieros y no puede interpretarse como tal. La información objetiva aquí contenida ha sido obtenida o derivada de fuentes consideradas confiables por el autor y Alpha Architect pero no necesariamente con todo incluido y no está garantizada en cuanto a su exactitud y no debe considerarse como una representación o garantía , Expresa o implícita, en cuanto a la exactitud o integridad de las informaciones, y la información adjunta no debe servir como base para cualquier decisión de inversión. Ninguna parte de este material puede ser reproducida de ninguna forma, ni mencionada en ninguna otra publicación, sin el permiso expreso por escrito de Alpha Architect. Sobre el autor Después de servir como un capitán en los Estados Unidos Marine Corps, el Dr. Gray recibió un doctorado, y fue profesor de finanzas en la Universidad de Drexel. El interés del Dr. Grays en el emprendimiento y las finanzas conductuales lo llevó a fundar Alpha Architect. El Dr. Gray ha publicado tres libros: EMBEDDED: A Marine Corps Adviser Dentro del Ejército iraquí, VALOR CUANTITATIVO: Una guía para automatizar la inversión inteligente y eliminar los errores de comportamiento, y DIY ADVISOR FINANCIERO: Una solución simple para construir y proteger su riqueza. Sus numerosos trabajos publicados han sido destacados en CBNC, CNN, NPR, Motley Fool, WSJ Market Watch, CFA Institute, Inversor Institucional y CBS News. Dr. Gray obtuvo un MBA y un doctorado en finanzas de la Universidad de Chicago y se graduó magna cum laude con un BS de la Wharton School de la Universidad de Pennsylvania. Moving promedio y exponencial modelos de suavizado Como un primer paso para ir más allá de los modelos de media, Los modelos de caminata aleatoria y los modelos de tendencias lineales, los patrones no estacionales y las tendencias pueden extrapolarse usando un modelo de media móvil o suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo por el cual los pronósticos tenderán a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - i. e. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es variable continuamente, por lo que puede optimizarse fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente un menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavizado exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de Pronóstico. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede ser generalizado para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en varias formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esta sería la previsión para Y en el período t1). Entonces, Squot denote la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0.3048 y 946 0.008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observa esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha ocurrido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápidamente a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)
No comments:
Post a Comment