zastosowanie funkcji okna wykładniczego jest po raz pierwszy przypisane Poissonowi jako rozszerzenie techniki analizy numerycznej z XVII wieku, a później przyjęte przez społeczność przetwarzania sygnałów w latach 40. Wygładzanie wykładnicze zostało po raz pierwszy zaproponowane w literaturze statystycznej bez cytowania do poprzedniej pracy Roberta Goodella Browna w 1956, a następnie rozszerzone przez Charlesa C. Holta w 1957., Poniższe sformułowanie, które jest powszechnie stosowane, przypisuje się Brownowi i jest znane jako „proste wykładnicze wygładzanie Browna”. Wszystkie metody Holta, Wintersa i Browna mogą być postrzegane jako proste zastosowanie filtrowania rekurencyjnego, po raz pierwszy Znalezione w 1940 roku do konwersji filtrów finite impulse response (FIR)do filtrów nieskończonej odpowiedzi impulsowej.
najprostszą formę wygładzania wykładniczego daje wzór:
S T = α x T + (1 − α ) s t − 1 = s T − 1 + α ( x T − s T − 1 ) . {\displaystyle s_{t}= \ alpha x_{t}+(1-\alpha )s_{t-1}=s_{t-1} + \ alpha (x_{t}-s_{t-1}).,}
Gdzie α {\displaystyle \ alpha } jest współczynnikiem wygładzania, a 0 ≤ α ≤ 1 {\displaystyle 0 \ leq \ alpha \ leq 1}. Innymi słowy, gładka statystyka s t {\displaystyle s_{t}} jest prostą średnią ważoną bieżącej obserwacji x T {\displaystyle x_{t}} i poprzedniej gładkiej statystyki s T-1 {\displaystyle s_{t-1}} . Proste wygładzanie wykładnicze jest łatwe do zastosowania i tworzy wygładzoną statystykę, gdy tylko dostępne są dwie obserwacje.,Termin współczynnik wygładzania stosowany do α {\displaystyle \alpha } jest tu czymś w rodzaju błędnika, ponieważ większe wartości α {\displaystyle \ alpha} faktycznie zmniejszają poziom wygładzania, a w przypadku ograniczającym α {\displaystyle \alpha } = 1 Seria wyjściowa jest tylko obserwacją bieżącą. Wartości α {\displaystyle \ alpha } bliskie Jedynce mają mniejszy efekt wygładzania i dają większą wagę ostatnim zmianom danych, podczas gdy wartości α {\displaystyle \ alpha } bliższe zero mają większy efekt wygładzania i są mniej wrażliwe na ostatnie zmiany.,
W przeciwieństwie do innych metod wygładzania, takich jak prosta średnia ruchoma, technika ta nie wymaga żadnej minimalnej liczby obserwacji, zanim zacznie przynosić wyniki. W praktyce jednak „dobra średnia” nie zostanie osiągnięta, dopóki kilka próbek nie zostanie uśrednionych razem; na przykład stały sygnał zajmie około 3/α {\displaystyle 3 / \alpha } etapy, aby osiągnąć 95% rzeczywistej wartości., Aby dokładnie odtworzyć oryginalny sygnał bez utraty informacji, wszystkie etapy wykładniczej średniej ruchomej muszą być również dostępne, ponieważ starsze próbki rozpadają się wykładniczo. Jest to w przeciwieństwie do prostej średniej ruchomej, w którym niektóre próbki mogą być pomijane bez tak dużej utraty informacji ze względu na stałą wagę próbek w ramach średniej. Jeśli znana liczba próbek zostaną pominięte, można dostosować średnią ważoną dla tego, jak również, dając równą wagę do nowej próbki i wszystkie te, które mają być pominięte.,
Ta prosta forma wygładzania wykładniczego jest również znana jako wykładniczo ważona średnia krocząca (EWMA). Technicznie można go również klasyfikować jako autoregresywną zintegrowaną średnią ruchomą (ARIMA) (0,1,1) model bez stałego terminu.
stała Czasowaedit
α = 1 − e − Δ t/τ {\displaystyle \alpha =1-E^{-\Delta T / \tau}}
Gdzie Δ t {\displaystyle \Delta T} jest przedziałem czasowym próbkowania dyskretnej implementacji czasu., Jeśli Czas próbkowania jest szybki w porównaniu ze stałą czasową ( Δ t τ τ {\displaystyle \Delta T\ll \tau } ) to
α ≈ Δ t τ {\displaystyle \alpha \approx {\frac {\Delta T}{\tau }}}
wybór początkowej wygładzonej wartościedytuj
zauważ, że w powyższej definicji s 0 {\displaystyle s_{0}} jest inicjalizowane na x 0 {\displaystyle x_{0}} . Ponieważ wygładzanie wykładnicze wymaga, aby na każdym etapie mieliśmy poprzednią prognozę, nie jest oczywiste, jak uruchomić metodę., Można by założyć, że początkowa prognoza jest równa początkowej wartości popytu, jednak podejście to ma poważną wadę. Wygładzanie wykładnicze ma duże znaczenie dla wcześniejszych obserwacji, więc początkowa wartość popytu będzie miała nieuzasadniony duży wpływ na wczesne prognozy. Problem ten można przezwyciężyć, pozwalając na ewolucję procesu przez rozsądną liczbę okresów (10 lub więcej) i wykorzystując średnią popytu w tych okresach jako wstępną prognozę., Istnieje wiele innych sposobów ustawienia tej wartości początkowej, ale ważne jest, aby pamiętać, że im mniejsza wartość α {\displaystyle \ alpha}, tym bardziej wrażliwa będzie twoja prognoza na wybór tej początkowej gładszej wartości s 0 {\displaystyle s_{0}}.
OptimizationEdit
dla każdej wykładniczej metody wygładzania musimy również wybrać wartość dla parametrów wygładzania. Dla prostego wygładzania wykładniczego istnieje tylko jeden parametr wygładzania (α), ale dla metod, które następują, zwykle jest więcej niż jeden parametr wygładzania.,
są przypadki, w których parametry wygładzania mogą być wybierane w sposób subiektywny – prognozujący określa wartość parametrów wygładzania na podstawie wcześniejszych doświadczeń. Jednak bardziej solidnym i obiektywnym sposobem uzyskania wartości dla nieznanych parametrów zawartych w dowolnej metodzie wygładzania wykładniczego jest oszacowanie ich na podstawie obserwowanych danych.,
SSE = ∑ t = 1 T (y t − y ^ T ∣ T − 1 ) 2 = ∑ t = 1 T e T 2 {\displaystyle {\text{SSE}}= \ sum _{t=1}^{t} (y_{t}-{\hat {y}}_{T \ mid t-1})^{2}=\sum _{t=1}^{t} e_{T}^{2}}
W przeciwieństwie do przypadku regresji (gdzie mamy wzory do bezpośredniego obliczania współczynników regresji, które minimalizują SSE) wiąże się to z nieliniowym problemem minimalizacji i musimy użyć narzędzia optymalizacyjnego, aby to wykonać.
„wykładnicza” nazwaedytuj
nazwa 'wykładnicza wygładzanie' jest przypisywana użyciu funkcji wykładniczej okna podczas splotu., Nie jest już przypisany do Holt, Winters & Brown.
przez bezpośrednie podstawienie równania definiującego proste wygładzanie wykładnicze z powrotem do siebie stwierdzamy, że
s t = α x T + ( 1 − α ) s T − 1 = α x T + α ( 1 − α ) x T − 1 + ( 1 − α ) 2 S T − 2 = α + ( 1 − α ) t x 0 . {\displaystyle {\begin{aligned}s_{t}&=\alpha x_{t}+(1-\alpha )s_{t-1}\&=\alpha x_{t}+\alpha (1-\alpha )x_{t-1}+(1-\alpha )^{2}s_{T-2}\\&=\Alpha\Left+(1-\Alpha )^{t}x_{0}.,inne statystyki s t {\displaystyle s_{t}} stają się średnią ważoną z coraz większej liczby wcześniejszych obserwacji s T − 1 , … , s t − {\displaystyle s_{t-1},\ldots ,s_{T-}} , A wagi przypisane do poprzednich obserwacji są proporcjonalne do terminów postępu geometrycznego 1 , ( 1 − α ) , ( 1 − α ) 2 , … , ( 1 − α ) n , … {\displaystyle 1,(1-\alpha ),(1-\alpha )^{2},\ldots ,(1-\Alpha )^{N},\ldots }
progresja geometryczna jest dyskretną wersją funkcji wykładniczej, więc to stąd pochodzi nazwa tej metody wygładzania zgodnie ze statystykami.,
porównanie ze średnią ruchomąedytuj
wygładzanie wykładnicze i średnia ruchoma mają podobne wady wprowadzania opóźnienia w stosunku do danych wejściowych. Chociaż można to skorygować poprzez przesunięcie wyniku o połowę długości okna dla symetrycznego jądra, takiego jak średnia krocząca lub Gaussa, nie jest jasne, jak odpowiednie byłoby to dla wygładzania wykładniczego. Oba mają mniej więcej taki sam rozkład błędu prognozy, gdy α = 2/(k + 1)., Różnią się one tym, że wygładzanie wykładnicze uwzględnia wszystkie dane z przeszłości, podczas gdy średnia krocząca uwzględnia tylko punkty danych z przeszłości K. Mówiąc obliczeniowo, różnią się one również tym, że średnia krocząca wymaga, aby ostatnie punkty danych K, lub punkt danych w lag K + 1 plus najnowszą wartość prognozy, należy zachować, podczas gdy wygładzanie wykładnicze wymaga tylko najnowszą wartość prognozy, aby być przechowywane.,
w literaturze przetwarzania sygnałów, stosowanie filtrów Nie-przyczynowych (symetrycznych) jest powszechne, a wykładnicza funkcja okna jest szeroko stosowana w ten sposób, ale stosuje się inną terminologię: wygładzanie wykładnicze jest równoważne filtrowi nieskończonej odpowiedzi impulsowej pierwszego rzędu (IIR), a średnia ruchoma jest równoważna skończonemu filtrowi odpowiedzi impulsowej z równymi współczynnikami ważenia.