el uso de la función de ventana exponencial se atribuye por primera vez a Poisson como una extensión de una técnica de análisis numérico del siglo XVII, y más tarde adoptada por la comunidad de procesamiento de señales en la década de 1940. El suavizado exponencial fue sugerido por primera vez en la literatura estadística sin citar el trabajo previo de Robert Goodell Brown en 1956, y luego ampliado por Charles C. Holt en 1957., La siguiente formulación, que es la que se usa comúnmente, se atribuye a Brown y se conoce como»suavizado exponencial simple de Brown». Todos los métodos de Holt, Winters y Brown pueden ser vistos como una simple aplicación de filtrado recursivo, que se encontró por primera vez en la década de 1940 para convertir los filtros de respuesta de impulso finito (FIR) en filtros de respuesta de impulso infinito.
La forma más sencilla de suavizado exponencial está dado por la fórmula:
s t = α x t + ( 1 − α ) s t − 1 = s t − 1 + α ( x t − s t − 1 ) . {\displaystyle s_{t}=\alpha x_{t}+(1-\alpha )s_{t-1}=s_{t-1}+\alpha (x_{t}-s_{t-1}).,}
donde α {\displaystyle \ alpha } es el factor de suavizado, y 0 ≤ α ≤ 1 {\displaystyle 0 \LEQ \alpha \ leq 1} . En otras palabras, el estadístico suavizado s t {\displaystyle s_ {t}} es un promedio ponderado simple de la observación actual x t {\displaystyle x_{t}} y el estadístico suavizado anterior s t − 1 {\displaystyle s_{t-1}} . El suavizado exponencial Simple se aplica fácilmente, y produce una estadística suavizada tan pronto como dos observaciones están disponibles.,El término factor de suavizado aplicado a α {\displaystyle \alpha } aquí es algo inapropiado, ya que los valores más grandes de α {\displaystyle \alpha } realmente reducen el nivel de suavizado, y en el caso límite con α {\displaystyle \alpha } = 1 la serie de salida es solo la observación actual. Los valores de α {\displaystyle \alpha } cerca de uno tienen menos de un efecto suavizante y dan mayor peso a los cambios recientes en los datos, mientras que los valores de α {\displaystyle \alpha } cerca de cero tienen un mayor efecto suavizante y son menos sensibles a los cambios recientes.,
a diferencia de otros métodos de suavizado, como la media móvil simple, esta técnica no requiere ningún número mínimo de observaciones que se hagan antes de que comience a producir resultados. En la práctica, sin embargo, un «buen promedio» no se logrará hasta que varias muestras se hayan promediado juntas; por ejemplo, una señal constante tomará aproximadamente 3 / α {\displaystyle 3/\alpha } etapas para alcanzar el 95% del valor real., Para reconstruir con precisión la señal original sin pérdida de Información, todas las etapas de la media móvil exponencial también deben estar disponibles, porque las muestras más antiguas decaen en peso exponencialmente. Esto contrasta con una media móvil simple, en la que algunas muestras se pueden omitir sin tanta pérdida de información debido a la ponderación constante de las muestras dentro de la media. Si se omite un número conocido de muestras, también se puede ajustar un promedio ponderado para esto, dando el mismo peso a la nueva muestra y a todas las que se omitan.,
esta forma simple de suavizado exponencial también se conoce como media móvil ponderada exponencialmente (EWMA). Técnicamente también se puede clasificar como un modelo de media móvil integrada autorregresiva (ARIMA) (0,1,1) sin término constante.
Constantedit del tiempo
α = 1-E-Δ T / τ {\displaystyle \alpha =1-e^{- \Delta T/\tau }}
donde Δ t {\displaystyle \Delta T} es el intervalo de tiempo de muestreo de la implementación del tiempo discreto., Si el tiempo de muestreo es rápido comparado con la constante de tiempo ( Δ T τ τ {\displaystyle \Delta T\ll \tau } ) entonces
α ≈ Δ T τ {\displaystyle \alpha \approx {\frac {\Delta T}{\tau }}}
eligiendo el valor suavizado inicialEditar
tenga en cuenta que en la definición anterior, s 0 {\displaystyle s_{0}} se está inicializando a x 0 {\displaystyle x_{0}} . Debido a que el suavizado exponencial requiere que en cada etapa tengamos el pronóstico anterior, no es obvio cómo comenzar el método., Podríamos suponer que el pronóstico inicial es igual al valor inicial de la demanda; sin embargo, este enfoque tiene un grave inconveniente. El suavizado exponencial pone un peso sustancial en las observaciones pasadas, por lo que el valor inicial de la demanda tendrá un efecto irrazonablemente grande en las previsiones tempranas. Este problema puede superarse permitiendo que el proceso evolucione durante un número razonable de períodos (10 o más) y utilizando el promedio de la demanda durante esos períodos como previsión inicial., Hay muchas otras formas de establecer este valor inicial, pero es importante tener en cuenta que cuanto menor sea el valor de α {\displaystyle \alpha } , más sensible será su pronóstico en la selección de este valor inicial más suave s 0 {\displaystyle s_{0}} .
OptimizationEdit
para cada método de suavizado exponencial también necesitamos elegir el valor para los parámetros de suavizado. Para el suavizado exponencial simple, solo hay un parámetro de suavizado (α), pero para los métodos que siguen generalmente hay más de un parámetro de suavizado.,
hay casos en los que los parámetros de suavizado se pueden elegir de manera subjetiva: el pronosticador especifica el valor de los parámetros de suavizado en función de la experiencia previa. Sin embargo, una forma más robusta y objetiva de obtener valores para los parámetros desconocidos incluidos en cualquier método de suavizado exponencial es estimarlos a partir de los datos observados.,
SSE = ∑ t = 1 T (Y t-y ^ t t t-1 ) 2 = ∑ t = 1 T E t 2 {\displaystyle {\text{SSE}}=\sum _{t = 1}^{T} (y_{t} – {\hat {y}}_{t \ mid t-1})^{2}=\sum _ {t = 1}^{T} e_{t}^{2}}
A diferencia del caso de regresión (donde tenemos fórmulas para calcular directamente los coeficientes de regresión que minimizan la ESS), esto implica un problema de minimización no lineal y necesitamos usar una herramienta de optimización para realizar esto.
nombre «exponencial «editar
El nombre «suavizado exponencial» se atribuye al uso de la función de ventana exponencial durante la convolución., Ya no se atribuye a Holt, Winters & Brown.
Por sustitución directa de la definición de la ecuación para el suavizado exponencial simple en sí mismo nos encontramos con que
s t = α x t + ( 1 − α ) s t − 1 = α x t + α ( 1 − α ) x t − 1 + ( 1 − α ) 2 s t − 2 = α + ( 1 − α ) t x 0 . {\displaystyle {\begin{aligned}s_{t}&=\alpha x_{t}+(1-\alpha )s_{t-1}\\&=\alpha x_{t}+\alpha (1-\alpha )x_{t-1}+(1-\alpha )^{2}s_{t-2}\\&=\alpha \left+(1-\alpha )^{t}x_{0}.,el estadístico othed s t {\displaystyle s_{t}} se convierte en el promedio ponderado de un número cada vez mayor de observaciones pasadas s t − 1 , … , s t − {\displaystyle s_{t-1},\ldots ,s_{t-}} , y los pesos asignados a observaciones anteriores son proporcionales a los Términos de la progresión geométrica 1 , ( 1 − α ) , ( 1 − α ) 2,^, (1 − α ) n, ^{\displaystyle 1,(1-\alpha ),(1-\alpha) ^ {2},\ldots ,(1-\Alpha) ^ {n},\ldots }
una progresión geométrica es la versión discreta de una función exponencial, por lo que aquí es donde se originó el nombre de este método de suavizado de acuerdo con la tradición estadística.,
comparación con la media movidaeditar
El suavizado exponencial y la media móvil tienen defectos similares de introducir un retraso en relación con los datos de entrada. Si bien esto se puede corregir cambiando el resultado a la mitad de la longitud de la ventana para un núcleo simétrico, como una media móvil o gaussiana, no está claro qué tan apropiado sería esto para el suavizado exponencial. También Ambos tienen aproximadamente la misma distribución de error de pronóstico cuando α = 2 / (k + 1)., Difieren en que el suavizado exponencial tiene en cuenta todos los datos pasados, mientras que la media móvil solo tiene en cuenta k puntos de datos pasados. Computacionalmente hablando, también difieren en que la media móvil requiere que los últimos puntos de datos K, o el punto de datos en lag K + 1 más el valor de pronóstico más reciente, para mantenerse, mientras que el suavizado exponencial solo necesita el valor de pronóstico más reciente para mantenerse.,
en la literatura de procesamiento de señales, el uso de filtros no causales (simétricos) es común, y la función de ventana exponencial se usa ampliamente de esta manera, pero se usa una terminología diferente: el suavizado exponencial es equivalente a un filtro de respuesta de impulso infinito (IIR) de primer orden y la media móvil es equivalente a un filtro de respuesta de impulso finito con factores de ponderación iguales.