Wednesday 27 December 2017

Metody wygładzania średniej i wykładniczej wygładzania


Wyjaśnienie wykładniczej wygładzania. skopiuj Copyright. Treści w InventoryOps są chronione prawami autorskimi i nie są dostępne do ponownej publikacji. Kiedy ludzie po raz pierwszy napotykają termin Wygładzanie wykładnicze, mogą pomyśleć, że to brzmi jak piekło dużo wygładzenia. niezależnie od wygładzania. Następnie zaczynają sobie wyobrazić skomplikowane matematyczne obliczenia, które prawdopodobnie wymagają zrozumienia z matematyki i mamy nadzieję, że dostępna jest wbudowana funkcja programu Excel, jeśli kiedykolwiek będą tego potrzebować. Rzeczywistość wygładzania wykładniczego jest znacznie mniej dramatyczna i znacznie mniej traumatyczna. Prawda jest taka, że ​​wygładzanie wykładnicze jest bardzo prostym obliczeniem, które wykonuje raczej proste zadanie. To po prostu ma skomplikowaną nazwę, ponieważ to, co technicznie dzieje się w wyniku tych prostych obliczeń, jest w rzeczywistości nieco skomplikowane. Aby zrozumieć wykładnicze wygładzanie, warto zacząć od ogólnej koncepcji wygładzania i kilku innych popularnych metod stosowanych w celu uzyskania wygładzenia. Co to jest wygładzanie? Wygładzanie jest bardzo powszechnym procesem statystycznym. W rzeczywistości regularnie napotykamy wygładzone dane w różnych formach w naszym codziennym życiu. Za każdym razem, gdy używasz średniej do opisania czegoś, używasz wygładzonej liczby. Jeśli zastanowisz się, dlaczego używasz średniej do opisania czegoś, szybko zrozumiesz pojęcie wygładzania. Na przykład właśnie przeżyliśmy najcieplejszą zimę na płycie. W jaki sposób jesteśmy w stanie oszacować ten odbiór, rozpoczynamy od zestawów danych dotyczących dziennych wysokich i niskich temperatur w okresie, który nazywamy zimą w każdym roku w zarejestrowanej historii. Ale to pozostawia nam sporo liczb, które przeskakują dookoła (nie jest tak, że każdego dnia ta zima była cieplejsza niż odpowiednie dni z poprzednich lat). Potrzebujemy liczby, która usuwa wszystkie te skoki z danych, abyśmy mogli łatwiej porównywać jedną zimę do następnej. Usunięcie przeskakiwania w danych nazywa się wygładzaniem iw tym przypadku możemy użyć zwykłej prostej do osiągnięcia wygładzenia. W prognozowaniu popytu używamy wygładzania, aby usunąć przypadkową zmienność (hałas) z naszego historycznego popytu. Dzięki temu możemy lepiej zidentyfikować wzorce popytu (głównie trend i sezonowość) oraz poziomy popytu, które można wykorzystać do oszacowania przyszłego popytu. Hałas na żądanie to taka sama koncepcja, jak codzienne przeskakiwanie danych o temperaturze. Nic dziwnego, że najczęstszym sposobem, w jaki ludzie usuwają hałas z historii popytu, jest użycie prostego przeciętnego lub konkretniej średniej ruchomej. Średnia ruchoma używa tylko predefiniowanej liczby okresów do obliczenia średniej, a te okresy przesuwają się wraz z upływem czasu. Na przykład, jeśli używam 4-miesięcznej średniej kroczącej, a dziś jest 1 maja, używam średniego popytu, które miało miejsce w styczniu, lutym, marcu i kwietniu. 1 czerwca będę korzystał z popytu od lutego, marca, kwietnia i maja. Średnia ważona ruchoma. Używając średniej, stosujemy tę samą wagę (wagę) do każdej wartości w zbiorze danych. W 4-miesięcznej średniej ruchomej każdy miesiąc reprezentował 25 średniej ruchomej. Używając historii popytu do prognozowania przyszłego popytu (a zwłaszcza przyszłego trendu), logiczne jest stwierdzenie, że chcesz, aby nowsza historia miała większy wpływ na twoją prognozę. Możemy dostosować nasze obliczenia średniej ruchomej, aby zastosować różne wagi w każdym okresie, aby uzyskać pożądane wyniki. Wyrażamy te wagi jako wartości procentowe, a suma wszystkich wag dla wszystkich okresów musi sumować się do 100. Dlatego, jeśli zdecydujemy, że chcemy zastosować 35 jako wagę dla najbliższego okresu w naszej 4-miesięcznej ważonej średniej kroczącej, możemy odejmij 35 od 100, aby znaleźć 65 pozostałych do podzielenia na pozostałe 3 okresy. Na przykład możemy otrzymać wagę odpowiednio 15, 20, 30 i 35 przez 4 miesiące (15 20 30 35 100). Wygładzanie wykładnicze. Jeśli powrócimy do koncepcji stosowania wagi do najnowszego okresu (np. 35 w poprzednim przykładzie) i rozłożenia pozostałej masy (obliczonej przez odjęcie ostatniego okresu waga 35 od 100 do 65), mamy podstawowe elementy składowe naszego obliczania wykładniczego wygładzania. Wejście sterujące obliczania wykładniczego wygładzania jest znane jako współczynnik wygładzania (zwany także stałą wygładzania). Zasadniczo przedstawia to wagę zastosowaną do ostatnich okresów popytu. Tak więc, gdy użyliśmy 35 jako wagi dla ostatniego okresu w ważonej średniej ruchomej, możemy również użyć 35 jako współczynnika wygładzania w naszym wykładniczym wyliczaniu wygładzającym, aby uzyskać podobny efekt. Różnica z wykładniczym obliczaniem wygładzania polega na tym, że zamiast tego, abyśmy musieli obliczyć, o ile waga ma zastosowanie do każdego poprzedniego okresu, współczynnik wygładzania jest wykorzystywany do tego automatycznie. Oto część wykładnicza. Jeśli użyjemy 35 jako czynnika wygładzającego, to waga ostatnich okresów będzie wynosić 35. Waga następnego okresu ostatniego popytu (okres przed ostatnim) wyniesie 65 z 35 (65 pochodzi z odjęcia 35 z 100). Oznacza to wagę 22,75 dla tego okresu, jeśli wykonujesz obliczenia matematyczne. Kolejne ostatnie okresy będą wynosić 65 z 65 z 35, co stanowi 14,79. Okres wcześniejszy będzie ważony jako 65 z 65 z 65 z 35, co równa się 9,61, i tak dalej. I to powraca przez wszystkie poprzednie okresy aż do początku czasu (lub punktu, w którym zacząłeś używać wygładzania wykładniczego dla tego konkretnego przedmiotu). Prawdopodobnie myślisz, że wygląda jak cała masa matematyki. Ale piękno wykładniczego obliczania wygładzania polega na tym, że zamiast przeliczać za każdy poprzedni okres za każdym razem, gdy otrzymujesz nowy okres, wystarczy użyć wyniku wykładniczego obliczenia wygładzania z poprzedniego okresu, aby przedstawić wszystkie poprzednie okresy. Czy jesteś jeszcze zdezorientowany? To będzie miało więcej sensu, gdy spojrzymy na rzeczywiste obliczenia. Zazwyczaj odnosimy się do wyjścia wykładniczego obliczania wygładzania jako następnej prognozy okresu. W rzeczywistości ostateczna prognoza wymaga trochę więcej pracy, ale dla celów tego konkretnego obliczenia będziemy ją nazywać prognozą. Obliczenia wygładzania wykładniczego są następujące: Ostatnie okresy wymagają pomnożenia przez współczynnik wygładzania. PLUS Ostatnia prognoza okresu pomnożona przez (jeden minus współczynnik wygładzania). D ostatnie okresy wymagają współczynnika wygładzania przedstawionego w postaci dziesiętnej (więc 35 będzie reprezentowane jako 0,35). F najświeższe prognozy okresów (wynik obliczeń wygładzających z poprzedniego okresu). OR (zakładając współczynnik wygładzania 0,35) (D 0,35) (F 0,65) Nie robi się o wiele prostsze. Jak widać, wszystko, czego potrzebujemy na dane wejściowe tutaj, to najnowsze okresy popytu i najnowsze prognozy okresów. Stosujemy czynnik wygładzający (ważenie) do ostatnich okresów, tak jak w obliczeniach ważonej średniej ruchomej. Następnie stosujemy pozostałą wagę (1 minus współczynnik wygładzania) do ostatnich prognozowanych okresów. Ponieważ ostatnia prognoza okresu została utworzona na podstawie poprzednich okresów, prognozy popytu i poprzednich okresów, które opierały się na popycie za poprzedni okres i prognozę za poprzedni okres, na podstawie zapotrzebowania za okres poprzedzający. oraz prognozę na okres wcześniejszy, który był oparty na okresie wcześniejszym. cóż, możesz zobaczyć, jak wszystkie poprzednie okresy popytu są reprezentowane w obliczeniach bez faktycznego cofania i ponownego przeliczania czegokolwiek. I to właśnie spowodowało początkową popularność wygładzania wykładniczego. Nie było tak dlatego, że lepiej wyrównało niż średnia ważona średnia ruchowa, ponieważ było to łatwiejsze do obliczenia w programie komputerowym. I dlatego, że nie trzeba było myśleć o tym, jakie ważenie ma dawać poprzednie okresy lub ile poprzednich okresów użyć, tak jak w ważonej średniej kroczącej. A ponieważ brzmiał po prostu chłodniej niż ważona średnia ruchoma. W rzeczywistości można argumentować, że ważona średnia ruchoma zapewnia większą elastyczność, ponieważ masz większą kontrolę nad ważeniem poprzednich okresów. Rzeczywistość jest jednym z nich może zapewnić godne wyniki, więc dlaczego nie pójść z łatwiejszym i chłodniejszym brzmieniem. Wygładzanie wykładnicze w Excelu Pozwala zobaczyć, jak to faktycznie wygląda w arkuszu kalkulacyjnym z prawdziwymi danymi. skopiuj Copyright. Treści w InventoryOps są chronione prawami autorskimi i nie są dostępne do ponownej publikacji. Na rysunku 1A mamy arkusz kalkulacyjny Excel z 11-tygodniowym zapotrzebowaniem i wykładniczo wygładzoną prognozą obliczoną na podstawie tego popytu. Zastosowałem współczynnik wygładzania równy 25 (0,25 w komórce C1). Aktualna aktywna komórka to Cell M4, która zawiera prognozę na tydzień 12. Na pasku formuły można zobaczyć formułę: (L3C1) (L4 (1-C1)). Tak więc jedynymi bezpośrednimi wejściami do tego obliczenia są poprzednie okresy popytu (komórka L3), poprzednie prognozy okresów (komórka L4) i czynnik wygładzający (komórka C1, pokazana jako bezwzględne odwołanie do komórki C1). Po rozpoczęciu obliczania wygładzania wykładniczego musimy ręcznie podłączyć wartość pierwszej prognozy. Tak więc w komórce B4 zamiast formuły wpisaliśmy popyt z tego samego okresu co prognoza. W komórce C4 mamy nasze pierwsze obliczenie wygładzania wykładniczego (B3C1) (B4 (1-C1)). Następnie możemy skopiować komórkę C4 i wkleić ją w komórkach od D4 do M4, aby wypełnić pozostałe komórki naszej prognozy. Możesz teraz kliknąć dwukrotnie dowolną komórkę prognozy, aby zobaczyć, że jest ona oparta na komórce z poprzednimi okresami prognozy i komórce z poprzednim okresem. Tak więc każde kolejne wykładnicze obliczanie wygładzania dziedziczy wyniki poprzedniej wykładniczej kalkulacji wygładzania. To, w jaki sposób zapotrzebowanie poprzednich okresów jest reprezentowane w ostatnich obliczeniach okresów, nawet jeśli obliczenia te nie odnoszą się bezpośrednio do tych poprzednich okresów. Jeśli chcesz mieć ochotę, możesz użyć funkcji precedersów Excela. Aby to zrobić, kliknij komórkę M4, a następnie na pasku narzędzi wstążki (Excel 2007 lub 2017) kliknij kartę Formuły, a następnie kliknij opcję Śledź wstępne. Będzie narysować linie łączące do pierwszego poziomu precedensów, ale jeśli będziesz nadal klikać Trace Precedents, narysuje linie łączące do wszystkich poprzednich okresów, aby pokazać dziedziczone relacje. Teraz zobaczmy, co dla nas wygładziło wykładnicze. Rysunek 1B pokazuje wykres liniowy naszego popytu i prognozy. Sprawa pokazuje, w jaki sposób wykładniczo wygładzona prognoza usuwa większość nierówności (przeskakiwania) z tygodniowego popytu, ale wciąż udaje się podążać za tendencją wzrostową popytu. Zauważysz również, że wygładzona linia prognozy jest zwykle niższa niż linia popytu. Jest to znane jako opóźnienie trendu i jest efektem ubocznym procesu wygładzania. Za każdym razem, gdy używasz wygładzania, gdy trend jest obecny, twoja prognoza będzie opóźniona w stosunku do trendu. Dotyczy to dowolnej techniki wygładzania. W rzeczywistości, gdybyśmy kontynuowali ten arkusz kalkulacyjny i zaczęli wprowadzać mniejszą liczbę popytu (tworząc tendencję spadkową), zobaczylibyśmy spadek linii popytu, a linia trendu przesunęła się nad nią, zanim zacznie podążać za trendem spadkowym. To dlatego poprzednio wspomniałem o wynikach obliczeń wykładniczych wygładzania, które nazywamy prognozą, nadal wymaga jeszcze więcej pracy. Prognozowanie jest o wiele większe niż tylko wygładzenie popytu. Musimy wprowadzić dodatkowe korekty dotyczące takich zjawisk jak opóźnienie trendu, sezonowość, znane zdarzenia, które mogą wpływać na popyt itp. Ale to wszystko wykracza poza zakres tego artykułu. Najprawdopodobniej spotkasz się również z terminami wygładzania podwójnie wykładniczego i potrójnego wykładniczego. Warunki te są nieco mylące, ponieważ nie można wielokrotnie wygładzać popytu (możesz, jeśli chcesz, ale nie o to tutaj chodzi). Warunki te reprezentują wykorzystanie wygładzania wykładniczego dla dodatkowych elementów prognozy. Dzięki prostemu wygładzaniu wykładniczemu wyrównujesz zapotrzebowanie bazowe, ale dzięki wygładzeniu o podwójnej wykładniczce wygładzasz bazowy popyt i trend, a dzięki potrójnemu wykładniczemu wygładzasz podstawowe zapotrzebowanie plus trend i sezonowość. Drugim najczęściej zadawanym pytaniem o wygładzanie wykładnicze jest to, gdzie dostaję mój czynnik wygładzający. Nie ma tu magicznej odpowiedzi, musisz przetestować różne czynniki wygładzania danymi o zapotrzebowaniu, aby zobaczyć, co daje najlepsze wyniki. Istnieją obliczenia, które mogą automatycznie ustawiać (i zmieniać) współczynnik wygładzania. Spadają pod pojęciem adaptacyjnego wygładzania, ale trzeba z nimi uważać. Po prostu nie ma idealnej odpowiedzi i nie należy ślepo wprowadzać żadnych obliczeń bez dokładnego testowania i dokładnego zrozumienia tego, co to obliczenie robi. Powinieneś również uruchomić scenariusze typu "co, jeśli", aby zobaczyć, jak te obliczenia reagują na zmiany popytu, które obecnie nie istnieją w danych o popycie, których używasz do testowania. Przykład danych użyty wcześniej był bardzo dobrym przykładem sytuacji, w której naprawdę trzeba przetestować inne scenariusze. Ten konkretny przykład danych pokazuje nieco stałą tendencję wzrostową. Wiele dużych firm z bardzo drogim oprogramowaniem prognostycznym miało poważne kłopoty w niedalekiej przeszłości, kiedy ich ustawienia oprogramowania, które zostały ulepszone dla rozwijającej się gospodarki, nie zareagowały dobrze, gdy gospodarka zaczęła się stagnować lub kurczyć. Takie rzeczy zdarzają się, gdy nie rozumiesz, co faktycznie robią twoje obliczenia (oprogramowanie). Gdyby zrozumieli swój system prognostyczny, wiedzieliby, że muszą wskoczyć i coś zmienić, gdy nastąpią gwałtowne dramatyczne zmiany w ich działalności. Oto wyjaśnione są podstawy wygładzania wykładniczego. Chcesz dowiedzieć się więcej na temat korzystania z wygładzania wykładniczego w rzeczywistej prognozie, zapoznaj się z moją książką Objaśnienie zarządzania zasobami. skopiuj Copyright. Treści w InventoryOps są chronione prawami autorskimi i nie są dostępne do ponownej publikacji. Dave Piasecki. jest właścicielem operacyjnym Inventory Operations Consulting LLC. firma doradcza świadcząca usługi związane z zarządzaniem zapasami, obsługą materiałów i działalnością magazynową. Ma ponad 25 lat doświadczenia w zarządzaniu operacjami i można go uzyskać za pośrednictwem swojej strony internetowej (inwentaryzacji), gdzie utrzymuje dodatkowe istotne informacje. Moje wygładzanie Business Expansion wygrywa wcześniejsze obserwacje z wykładniczo malejącymi wagami do prognozowania przyszłych wartości. Ten schemat wygładzania rozpoczyna się od ustawienia (S2) do (y1), gdzie (Si) oznacza wygładzoną obserwację lub EWMA, i (y) oznacza oryginalną obserwację. Indeksy dolne odnoszą się do okresów (1, 2,, ldots,, n). W trzecim okresie (S3 alfa y2 (1-alfa) S2) i tak dalej. Nie ma (S1) wygładzona seria zaczyna się od wygładzonej wersji drugiej obserwacji. Dla dowolnego okresu czasu (t), wygładzoną wartość (St) można znaleźć obliczając St alfa y (1-alfa) S ,,,,,,, 0 Rozwinięte równanie dla (S5) Na przykład, rozszerzone równanie dla wygładzonego wartość (S5) to: S5 alfa w lewo (1-alfa) 0 y (1-alfa) 1 y (1-alfa) 2 y w prawo (1-alfa) 3 S2. Ilustruje zachowanie wykładnicze Przedstawia zachowanie wykładnicze. Wagi (alfa (1-alfa) t) zmniejszają się geometrycznie, a ich suma jest równa jedności, jak pokazano poniżej, przy użyciu właściwości szeregu geometrycznego: suma alfa (1-alfa) i alfa lewy frak prawy 1 - (1-alfa) t. Z ostatniej formuły widać, że okres sumowania pokazuje, że udział w wygładzonej wartości (St) zmniejsza się w każdym kolejnym okresie czasu. Przykład dla (alpha 0.3) Niech (alpha 0.3). Zwróć uwagę, że ciężary (alfa (1-alfa) t) maleją wykładniczo (geometrycznie) w czasie. Suma błędów kwadratowych (SSE) 208,94. Średnia kwadratów błędów (MSE) to SSE 11 19.0. Oblicz dla różnych wartości (alfa) MSE ponownie obliczono dla (alfa 0,5) i okazało się być 16,29, więc w tym przypadku wolelibyśmy (alfa) 0,5. Czy możemy zrobić to lepiej Możemy zastosować sprawdzoną metodę prób i błędów. Jest to procedura iteratywna rozpoczynająca się od zakresu (alpha) od 0,1 do 0,9. Określamy najlepszy początkowy wybór dla (alfa), a następnie szukamy pomiędzy (alfa - Delta) i (alfa Delta). Moglibyśmy powtórzyć to być może jeszcze raz, aby znaleźć najlepsze (alfa) do 3 miejsc po przecinku. Można zastosować nieliniowe optymalizatory Ale są lepsze metody wyszukiwania, takie jak procedura Marquardt. Jest to nieliniowy optymalizator, który minimalizuje sumę kwadratów reszt. Ogólnie rzecz biorąc, większość dobrze zaprojektowanych programów statystycznych powinno być w stanie znaleźć wartość (alfa), która minimalizuje MSE. Przykładowy wykres pokazujący wygładzone dane dla 2 wartości (alfa) Wprowadzenie do ARIMA: modele niesezonowe Równanie prognostyczne ARIMA (p, d, q): Modele ARIMA są w teorii najbardziej ogólną klasą modeli do prognozowania szeregów czasowych, które mogą być 8208stationary 8221 przez różnicowanie (jeśli to konieczne), być może w połączeniu z nieliniowymi transformacjami, takimi jak rejestracja lub deflacja (jeśli to konieczne). Zmienna losowa, która jest szeregiem czasowym, jest nieruchoma, jeśli jej właściwości statystyczne są stałe w czasie. Seria stacjonarna nie ma trendu, jej wahania wokół średniej mają stałą amplitudę i poruszają się w spójny sposób. tj. jego krótkoterminowe wzorce czasu losowego zawsze wyglądają tak samo w sensie statystycznym. Ten ostatni warunek oznacza, że ​​jego autokorelacje (korelacje z jego własnymi wcześniejszymi odchyleniami od średniej) pozostają stałe w czasie, lub równoważnie, że jego widmo mocy pozostaje stałe w czasie. Zmienna losowa tej postaci może być oglądana (jak zwykle) jako kombinacja sygnału i szumu, a sygnał (jeśli jest widoczny) może być wzorem szybkiej lub wolnej średniej rewersji, lub sinusoidalnej oscylacji, lub szybkiej przemiany w znaku , a także może mieć składnik sezonowy. Model ARIMA może być postrzegany jako 8220filter8221, który próbuje oddzielić sygnał od szumu, a sygnał jest następnie ekstrapolowany w przyszłość w celu uzyskania prognoz. Równanie prognostyczne ARIMA dla stacjonarnych szeregów czasowych jest równaniem liniowym (to jest typu regresyjnym), w którym predyktory składają się z opóźnień zmiennej zależnej i opóźnień błędów prognoz. Oznacza to: Przewidywaną wartość Y stałej stałej lub ważoną sumę jednej lub więcej ostatnich wartości Y i lub ważoną sumę jednej lub więcej ostatnich wartości błędów. Jeśli predykatory składają się tylko z opóźnionych wartości Y., jest to model czysto autoregresyjny (8220a-regressed8221), który jest tylko szczególnym przypadkiem modelu regresji i który może być wyposażony w standardowe oprogramowanie regresyjne. Na przykład, autoregresyjny model pierwszego rzędu (8220AR (1) 8221) dla Y jest prostym modelem regresji, w którym zmienna niezależna jest po prostu Y opóźniona o jeden okres (LAG (Y, 1) w Statgraphics lub YLAG1 w RegressIt). Jeśli niektóre z predyktorów są opóźnieniami błędów, to model ARIMA NIE jest modelem regresji liniowej, ponieważ nie ma sposobu, aby określić 8220last okres8217s błąd8221 jako zmienną niezależną: błędy muszą być obliczane na podstawie okresu do okresu kiedy model jest dopasowany do danych. Z technicznego punktu widzenia problem z wykorzystaniem opóźnionych błędów jako czynników predykcyjnych polega na tym, że przewidywania model8217 nie są liniowymi funkcjami współczynników. mimo że są liniowymi funkcjami przeszłych danych. Współczynniki w modelach ARIMA, które zawierają opóźnione błędy, muszą być oszacowane przez nieliniowe metody optymalizacji (8220hill-climbing8221), a nie przez samo rozwiązanie układu równań. Akronim ARIMA oznacza Auto-Regressive Integrated Moving Average. Lagi z stacjonarnej serii w równaniu prognostycznym nazywane są "wartościami dodatnimi", opóźnienia błędów prognoz są nazywane "przesunięciem średniej", a szeregi czasowe, które muszą być różnicowane, aby stały się stacjonarne, są uważane za "podzielone" wersje stacjonarnej serii. Modele random-walk i random-tendencja, modele autoregresyjne i modele wygładzania wykładniczego są szczególnymi przypadkami modeli ARIMA. Niesezonowy model ARIMA jest klasyfikowany jako model DAIMIMA (p, d, q), gdzie: p to liczba terminów autoregresyjnych, d to liczba niesezonowych różnic potrzebnych do stacjonarności, a q to liczba opóźnionych błędów prognozy w równanie predykcji. Równanie prognostyczne jest skonstruowane w następujący sposób. Po pierwsze, niech y oznacza różnicę d Y. Oznacza to: Zwróć uwagę, że druga różnica Y (przypadek d2) nie jest różnicą od 2 okresów temu. Jest to raczej różnica między pierwszą a różnicą. który jest dyskretnym analogiem drugiej pochodnej, tj. lokalnym przyspieszeniem szeregu, a nie jego lokalnym trendem. Pod względem y. ogólne równanie prognostyczne jest następujące: Tutaj parametry średniej ruchomej (9528217 s) są zdefiniowane w taki sposób, że ich znaki są ujemne w równaniu, zgodnie z konwencją wprowadzoną przez Boxa i Jenkinsa. Niektórzy autorzy i oprogramowanie (w tym język programowania R) definiują je, aby zamiast tego mieli znaki plus. Kiedy rzeczywiste liczby są podłączone do równania, nie ma dwuznaczności, ale ważne jest, aby wiedzieć, którą konwencję używa twoje oprogramowanie podczas odczytu danych wyjściowych. Często parametry są tam oznaczone przez AR (1), AR (2), 8230 i MA (1), MA (2), 8230 itd. Aby zidentyfikować odpowiedni model ARIMA dla Y. zaczynasz od określenia kolejności różnicowania (d) konieczność stacjonowania serii i usunięcia ogólnych cech sezonowości, być może w połączeniu z transformacją stabilizującą warianty, taką jak rejestracja lub deflacja. Jeśli zatrzymasz się w tym momencie i będziesz przewidywał, że zróżnicowana seria jest stała, dopasowałeś jedynie model losowego spaceru lub losowego trendu. Jednak stacjonarne serie mogą nadal mieć błędy związane z auto - korelacjami, co sugeruje, że w równaniu prognostycznym potrzebna jest również pewna liczba terminów AR (p 8805 1) i kilka warunków MA (q 8805 1). Proces określania wartości p, d i q, które są najlepsze dla danej serii czasowej, zostanie omówiony w późniejszych sekcjach notatek (których linki znajdują się na górze tej strony), ale podgląd niektórych typów nietypowych modeli ARIMA, które są powszechnie spotykane, podano poniżej. ARIMA (1,0,0) Model autoregresyjny pierwszego rzędu: jeśli seria jest stacjonarna i autokorelowana, być może można ją przewidzieć jako wielokrotność jej poprzedniej wartości plus stałą. Równanie prognostyczne w tym przypadku wynosi 8230, co oznacza, że ​​Y cofnął się sam w sobie o jeden okres. Jest to model 8220ARIMA (1,0,0) constant8221. Jeżeli średnia z Y wynosi zero, wówczas nie zostałoby uwzględnione stałe wyrażenie. Jeśli współczynnik nachylenia 981 1 jest dodatni i mniejszy niż 1 w skali (musi być mniejszy niż 1 waga, jeśli Y jest nieruchomy), model opisuje zachowanie polegające na odwróceniu średniej, w którym należy przypisać wartość kolejnego okresu 817 razy 981 razy jako daleko od średniej, jak ta wartość okresu. Jeżeli 981 1 jest ujemny, przewiduje zachowanie średniej odwrócenia z naprzemiennością znaków, tj. Przewiduje również, że Y będzie poniżej średniego następnego okresu, jeśli jest powyżej średniej tego okresu. W modelu autoregresyjnym drugiego rzędu (ARIMA (2,0,0)), po prawej stronie pojawi się również termin Y t-2 i tak dalej. W zależności od znaków i wielkości współczynników, model ARIMA (2,0,0) może opisywać układ, którego średnia rewersja zachodzi w sposób oscylacyjny sinusoidalnie, podobnie jak ruch masy na sprężynie poddanej losowym wstrząsom . Próba losowa ARIMA (0,1,0): Jeśli seria Y nie jest nieruchoma, najprostszym możliwym modelem jest model losowego spaceru, który można uznać za ograniczający przypadek modelu AR (1), w którym autoregresyjny Współczynnik jest równy 1, tzn. szeregowi z nieskończenie powolną średnią rewersją. Równanie predykcji dla tego modelu można zapisać jako: gdzie stałym terminem jest średnia zmiana okresu do okresu (tj. Dryf długoterminowy) w Y. Ten model może być dopasowany jako model regresji bez przechwytywania, w którym pierwsza różnica Y jest zmienną zależną. Ponieważ zawiera on (tylko) niesezonową różnicę i stały termin, jest klasyfikowany jako model DAIMA (0,1,0) ze stałą. Często Model bezładnego spaceru byłby ARIMA (0,1; 0) model bez stałego ARIMA (1,1,0) różny model autoregresyjny pierwszego rzędu: Jeśli błędy modelu losowego spaceru są autokorelowane, być może problem można rozwiązać, dodając jedno opóźnienie zmiennej zależnej do równania predykcji - - to znaczy przez regresję pierwszej różnicy Y, która sama w sobie jest opóźniona o jeden okres. To przyniosłoby następujące równanie predykcji: które można przekształcić w To jest autoregresyjny model pierwszego rzędu z jednym rzędem niesezonowego różnicowania i stałym terminem - tj. model ARIMA (1,1,0). ARIMA (0,1,1) bez stałego prostego wygładzania wykładniczego: Inna strategia korekcji błędów związanych z autokorelacją w modelu losowego spaceru jest zasugerowana przez prosty model wygładzania wykładniczego. Przypomnijmy, że w przypadku niektórych niestacjonarnych szeregów czasowych (na przykład takich, które wykazują głośne wahania wokół wolno zmieniającej się średniej), model spaceru losowego nie działa tak dobrze, jak średnia ruchoma wartości z przeszłości. Innymi słowy, zamiast brać ostatnią obserwację jako prognozę następnej obserwacji, lepiej jest użyć średniej z ostatnich kilku obserwacji w celu odfiltrowania hałasu i dokładniejszego oszacowania średniej lokalnej. Prosty model wygładzania wykładniczego wykorzystuje wykładniczo ważoną średnią ruchomą przeszłych wartości, aby osiągnąć ten efekt. Równanie predykcji dla prostego modelu wygładzania wykładniczego można zapisać w wielu matematycznie równoważnych formach. jedną z nich jest tak zwana forma 8220, korekta zera 8221, w której poprzednia prognoza jest korygowana w kierunku popełnionego błędu: Ponieważ e t-1 Y t-1 - 374 t-1 z definicji, można to przepisać jako : co jest równaniem ARIMA (0,1,1) - bez stałej prognozy z 952 1 1 - 945. Oznacza to, że możesz dopasować proste wygładzanie wykładnicze, określając je jako model ARIMA (0,1,1) bez stała, a szacowany współczynnik MA (1) odpowiada 1-minus-alfa w formule SES. Przypomnijmy, że w modelu SES średni wiek danych w prognozach z wyprzedzeniem 1 roku wynosi 1 945. Oznacza to, że będą one pozostawać w tyle za trendami lub punktami zwrotnymi o około 1 945 okresów. Wynika z tego, że średni wiek danych w prognozach 1-okresowych modelu ARIMA (0,1,1) - bez stałej wynosi 1 (1 - 952 1). Tak więc, na przykład, jeśli 952 1 0.8, średnia wieku wynosi 5. Ponieważ 952 1 zbliża się do 1, ARIMA (0,1,1) - bez stałego modelu staje się bardzo długookresową średnią ruchomą, a jako 952 1 zbliża się do 0, staje się modelem losowego chodzenia bez dryfu. Jaki jest najlepszy sposób korekcji autokorelacji: dodawanie terminów AR lub dodawanie terminów MA W dwóch poprzednich modelach omówionych powyżej, problem związanych z autokorelacją błędów w modelu losowego spaceru został ustalony na dwa różne sposoby: przez dodanie opóźnionej wartości różnej serii do równania lub dodanie opóźnionej wartości błędu prognozy. Które podejście jest najlepsze Zasada praktyczna dla tej sytuacji, która zostanie omówiona bardziej szczegółowo w dalszej części, polega na tym, że pozytywna autokorelacja jest zwykle najlepiej traktowana przez dodanie do modelu warunku AR, a negatywna autokorelacja jest zwykle najlepiej traktowana przez dodanie Termin magisterski. W biznesowych i ekonomicznych szeregach czasowych negatywna autokorelacja często pojawia się jako artefakt różnicowania. (Ogólnie rzecz biorąc, różnicowanie zmniejsza pozytywną autokorelację, a nawet może spowodować przełączenie z autokorelacji dodatniej na ujemną). Tak więc model ARIMA (0,1,1), w którym różnicowanie jest połączone z terminem MA, jest częściej używany niż Model ARIMA (1,1,0). ARIMA (0,1,1) o stałym prostym wygładzaniu wykładniczym ze wzrostem: Dzięki wdrożeniu modelu SES jako modelu ARIMA można uzyskać pewną elastyczność. Po pierwsze, szacowany współczynnik MA (1) może być ujemny. odpowiada to współczynnikowi wygładzania większemu niż 1 w modelu SES, co zwykle nie jest dozwolone w procedurze dopasowania modelu SES. Po drugie, masz możliwość włączenia stałego warunku w modelu ARIMA, jeśli chcesz, aby oszacować średni niezerowy trend. Model ARIMA (0,1,1) ze stałą ma równanie prognozy: prognozy jednokresowe z tego modelu są jakościowo podobne do tych z modelu SES, z tym że trajektoria prognoz długoterminowych jest zwykle linia nachylenia (której nachylenie jest równe mu) zamiast linii poziomej. ARIMA (0,2,1) lub (0,2,2) bez stałego liniowego wygładzania wykładniczego: liniowe modele wygładzania wykładniczego są modelami ARIMA, które wykorzystują dwie niesezonowe różnice w połączeniu z terminami MA. Druga różnica w serii Y nie jest po prostu różnicą między Y a nią opóźnioną o dwa okresy, ale raczej jest pierwszą różnicą pierwszej różnicy - a. e. zmiana w Y w okresie t. Tak więc druga różnica Y w okresie t jest równa (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Druga różnica funkcji dyskretnej jest analogiczna do drugiej pochodnej funkcji ciągłej: mierzy ona przyspieszenie cytadania lub inną krzywiznę w funkcji w danym punkcie czasu. Model ARIMA (0,2,2) bez stałej przewiduje, że druga różnica szeregu równa się funkcji liniowej dwóch ostatnich błędów prognozy: która może być uporządkowana jako: gdzie 952 1 i 952 2 to MA (1) i Współczynniki MA (2). Jest to ogólny liniowy model wygładzania wykładniczego. w zasadzie taki sam jak model Holt8217s, a model Brown8217s to szczególny przypadek. Wykorzystuje wykładniczo ważone średnie ruchome do oszacowania zarówno lokalnego poziomu, jak i lokalnego trendu w serii. Długoterminowe prognozy z tego modelu zbiegają się do linii prostej, której nachylenie zależy od średniej tendencji obserwowanej pod koniec serii. ARIMA (1,1,2) bez stałego liniowego tłumienia wykładniczego. Ten model jest zilustrowany na załączonych slajdach w modelach ARIMA. Ekstrapoluje lokalny trend pod koniec serii, ale spłaszcza go na dłuższych horyzontach prognozy, wprowadzając nutę konserwatyzmu, praktykę, która ma empiryczne wsparcie. Zobacz artykuł na ten temat: "Dlaczego działa Damped Trend" autorstwa Gardnera i McKenziego oraz artykuł "Zgodny z legendą" Armstronga i in. dla szczegółów. Ogólnie zaleca się trzymać modele, w których co najmniej jedno z p i q jest nie większe niż 1, tj. Nie próbować dopasować modelu takiego jak ARIMA (2,1,2), ponieważ może to prowadzić do przeuczenia oraz pytania o współczynniku równomolowym, które omówiono bardziej szczegółowo w uwagach dotyczących struktury matematycznej modeli ARIMA. Implementacja arkusza kalkulacyjnego: modele ARIMA, takie jak opisane powyżej, można łatwo wdrożyć w arkuszu kalkulacyjnym. Równanie predykcyjne jest po prostu równaniem liniowym, które odnosi się do przeszłych wartości pierwotnych szeregów czasowych i przeszłych wartości błędów. W ten sposób można skonfigurować arkusz kalkulacyjny prognozowania ARIMA, przechowując dane w kolumnie A, formułę prognozowania w kolumnie B i błędy (dane minus prognozy) w kolumnie C. Formuła prognozowania w typowej komórce w kolumnie B byłaby po prostu wyrażenie liniowe odnoszące się do wartości w poprzednich wierszach kolumn A i C, pomnożone przez odpowiednie współczynniki AR lub MA przechowywane w komórkach w innym miejscu arkusza kalkulacyjnego.

No comments:

Post a Comment