Die Verwendung der exponentiellen Fensterfunktion wird zuerst Poisson als Erweiterung einer numerischen Analysetechnik aus dem 17. Jahrhundert zugeschrieben und später von der Signalverarbeitungsgemeinschaft in den 1940er Jahren übernommen. exponentielle Glättung ist hier die Anwendung der exponentiellen oder Poisson-Fensterfunktion. Exponentielle Glättung ersten mal wurde in der statistischen Literatur ohne Zitate auf früheren arbeiten von Robert Goodell Brown im Jahr 1956, und dann erweitert durch Charles C. Holt im Jahr 1957., Die folgende Formulierung, die üblicherweise verwendet wird, wird Braun zugeschrieben und ist als „Browns einfache exponentielle Glättung“bekannt. Alle Methoden von Holt, Winters und Brown können als eine einfache Anwendung der rekursiven Filterung angesehen werden, die erstmals in den 1940er Jahren gefunden wurde, um Finite Impulse Response (FIR) – Filter in unendliche Impulsantwortfilter umzuwandeln.
Die einfachste form der exponentiellen Glättung ist gegeben durch die Formel:
s t = α x t + ( 1 − α ) s t − 1 = s t − 1 + α ( x-t − N − t- 1 ) . {\displaystyle s_{t}=\alpha x_{t}+(1-\alpha )s_{t-1}=s_{t-1}+\alpha (x_{t}-s_{t-1}).,}
wo α {\displaystyle \alpha } ist der Glättungsfaktor, und 0 ≤ α ≤ 1 {\displaystyle 0\leq \alpha \leq 1} . Mit anderen Worten, die geglättete Statistik s t {\displaystyle s_{t}} ist ein einfacher gewichteter Durchschnitt der aktuellen Beobachtung x t {\displaystyle x_{t}} und der vorherigen geglätteten Statistik s t-1 {\displaystyle s_{t-1}} . Einfache exponentielle Glättung wird leicht angewendet, und es erzeugt eine geglättete Statistik, sobald zwei Beobachtungen verfügbar sind.,Der Begriff Glättungsfaktor, der hier auf α {\displaystyle \alpha } angewendet wird, ist eine falsche Bezeichnung, da größere Werte von α {\displaystyle \alpha } tatsächlich den Glättungsgrad reduzieren und im Grenzfall mit α {\displaystyle \alpha } = 1 Die Ausgabeserie nur die aktuelle Beobachtung ist. Werte von α {\displaystyle \alpha } nahe eins haben weniger Glättungseffekt und geben den jüngsten Änderungen in den Daten ein größeres Gewicht, während Werte von α {\displaystyle \alpha } näher an Null einen größeren Glättungseffekt haben und weniger auf die jüngsten Änderungen reagieren.,
Im Gegensatz zu einigen anderen Glättungsmethoden, wie dem einfachen gleitenden Durchschnitt, erfordert diese Technik keine minimale Anzahl von Beobachtungen, bevor sie Ergebnisse liefert. In der Praxis wird jedoch erst dann ein „guter Durchschnitt“ erreicht, wenn mehrere Abtastwerte zusammen gemittelt wurden; Beispielsweise benötigt ein konstantes Signal ungefähr 3 / α {\displaystyle 3/\alpha } Stufen, um 95% des tatsächlichen Wertes zu erreichen., Um das ursprüngliche Signal ohne Informationsverlust genau rekonstruieren zu können, müssen auch alle Stufen des exponentiellen gleitenden Durchschnitts verfügbar sein, da ältere Proben exponentiell an Gewicht abfallen. Dies steht im Gegensatz zu einem einfachen gleitenden Durchschnitt, bei dem einige Stichproben ohne so großen Informationsverlust aufgrund der konstanten Gewichtung von Stichproben innerhalb des Durchschnitts übersprungen werden können. Wenn eine bekannte Anzahl von Stichproben übersehen wird, kann man auch einen gewichteten Durchschnitt dafür anpassen, indem man der neuen Stichprobe und allen zu übersprungenden Stichproben das gleiche Gewicht gibt.,
Diese einfache Form der exponentiellen Glättung wird auch als exponentiell gewichteter gleitender Durchschnitt (EWMA) bezeichnet. Technisch kann es auch als autoregressive Integrated Moving Average (ARIMA) (0,1,1) Modell ohne konstante Laufzeit klassifiziert werden.
Zeitkonstante:
α = 1-e-Δ T / τ {\displaystyle \alpha =1-e^{- \Delta T/\tau }}
wobei Δ T {\displaystyle \Delta T} das Abtastzeitintervall der diskreten Zeitimplementierung ist., Wenn die Abtastzeit im Vergleich zur Zeitkonstante schnell ist (Δ T ≪ τ {\displaystyle \Delta T\ll \tau}), dann
α ≈ Δ T τ {\displaystyle \alpha \ll {\frac {\Delta T}{\tau }}}
Auswahl des anfänglich geglätteten wertsEdit
Beachten Sie, dass in der obigen Definition s 0 {\displaystyle s_{0}} auf x 0 {\displaystyle x_{0}} initialisiert wird . Da die exponentielle Glättung erfordert, dass wir in jeder Phase die vorherige Prognose haben, ist es nicht offensichtlich, wie die Methode gestartet werden soll., Wir könnten davon ausgehen, dass die anfängliche Prognose dem Anfangswert der Nachfrage entspricht; Dieser Ansatz hat jedoch einen schwerwiegenden Nachteil. Die exponentielle Glättung belastet die Beobachtungen der Vergangenheit erheblich, so dass der Anfangswert der Nachfrage einen unangemessen großen Einfluss auf frühe Prognosen haben wird. Dieses Problem kann überwunden werden, indem der Prozess sich für eine angemessene Anzahl von Zeiträumen (10 oder mehr) entwickeln kann und der Durchschnitt der Nachfrage während dieser Zeiträume als anfängliche Prognose verwendet wird., Es gibt viele andere Möglichkeiten, diesen Anfangswert festzulegen , aber es ist wichtig zu beachten, dass je kleiner der Wert von α {\displaystyle \alpha} ist, desto empfindlicher ist Ihre Prognose bei der Auswahl dieses anfänglichen glatteren Werts s 0 {\displaystyle s_{0}} .
OptimizationEdit
Für jede exponentielle Glättungsmethode müssen wir auch den Wert für die Glättungsparameter auswählen. Für die einfache exponentielle Glättung gibt es nur einen Glättungsparameter (α), aber für die folgenden Methoden gibt es normalerweise mehr als einen Glättungsparameter.,
Es gibt Fälle, in denen die Glättungsparameter subjektiv gewählt werden können – der Prognostiker gibt den Wert der Glättungsparameter basierend auf früheren Erfahrungen an. Eine robustere und objektivere Möglichkeit, Werte für die unbekannten Parameter zu erhalten, die in einer exponentiellen Glättungsmethode enthalten sind, besteht jedoch darin, sie aus den beobachteten Daten zu schätzen.,
SSE = ∑ t = 1 T ( y t − y ^ t ∣ t − 1 ) 2 = ∑ t = 1 T e t 2 {\displaystyle {\text{SSE}}=\sum _{t=1}^{T}(y_{t}-{\hat {y}}_{t\mid t-1})^{2}=\sum _{t=1}^{T}e_{t}^{2}}
im Gegensatz zur regression Fall (wo wir Formeln direkt berechnen Sie die Regressionskoeffizienten, die minimieren die SSE) dies umfasst nicht-linear minimization problem, und wir müssen eine Optimierungs-tool, um dies durchzuführen.
“ Exponential „namingEdit
Der Name ‚exponential smoothing‘ wird der Verwendung der exponential window Funktion während der Faltung zugeschrieben., Es wird nicht mehr Holt, Winters & Brown zugeschrieben.
die Durch direkte substitution der definierenden Gleichung für die einfache exponentielle Glättung in sich selbst zurück finden wir, dass
s t = α x t + ( 1 − α ) s t − 1 = α x, t + α ( 1 − α ) x t − 1 + ( 1 − α ) 2 s t − 2 = α + ( 1 − α ) t x 0 . {\displaystyle {\begin{t}s_{t}&=\alpha x_{t}+(1-\alpha )s_{t-1}\\&=\alpha x_{t}+\alpha (1-\alpha )x_{t-1}+(1-\alpha )^{2}s_{t-2}\\&=\alpha \left+(1-\alpha )^{t}x_{0}.,othed Statistik s t {\displaystyle s_{t}} wird der gewichtete Durchschnitt einer größeren Anzahl von vergangenen Beobachtungen s t − 1 , … , s t − {\displaystyle s_{t-1},\ldots ,s_{t -}} und die GEWICHTE zugewiesen bisherigen Beobachtungen sind proportional zu den Bedingungen der geometrischen progression 1 , ( 1 − α) -, ( 1 − α ) 2 , … , ( 1 − α ) n , … {\displaystyle 1,(1-\alpha) (1-\alpha )^{2},\ldots ,(1-\alpha )^{n},\ldots }
Eine geometrische progression ist die diskrete version einer exponentiellen Funktion, so ist dies der name für diese Glättung-Methode entstanden laut Statistik lore.,
Vergleich mit Moving averageEdit
Exponentielle Glättung und gleitender Durchschnitt haben ähnliche Mängel bei der Einführung einer Verzögerung relativ zu den Eingabedaten. Während dies korrigiert werden kann, indem das Ergebnis für einen symmetrischen Kernel, wie einen gleitenden Durchschnitt oder Gaußschen, um die Hälfte der Fensterlänge verschoben wird, ist unklar, wie geeignet dies für eine exponentielle Glättung wäre. Sie haben auch beide ungefähr die gleiche Verteilung des Prognosefehlers, wenn α = 2 / (k + 1)., Sie unterscheiden sich darin, dass die exponentielle Glättung alle vergangenen Daten berücksichtigt, während der gleitende Durchschnitt nur k vergangene Datenpunkte berücksichtigt. Rechnerisch gesehen unterscheiden sie sich auch darin, dass der gleitende Durchschnitt erfordert, dass die letzten k Datenpunkte oder der Datenpunkt bei k + 1 plus dem neuesten Prognosewert beibehalten werden, während die exponentielle Glättung nur den neuesten Prognosewert erfordert.,
In der Signalverarbeitungsliteratur ist die Verwendung von nicht kausalen (symmetrischen) Filtern üblich, und die Exponentialfensterfunktion wird auf diese Weise weitgehend verwendet, es wird jedoch eine andere Terminologie verwendet: exponentielle Glättung entspricht einem Filter für unendliche Impulsantwort erster Ordnung (IIR) und gleitender Durchschnitt entspricht einem Filter für endliche Impulsantwort mit gleichen Gewichtungsfaktoren.