Prognozowanie i symulacje Wykład 6-7.doc
Wykład 6
(notatki do wykładu)
Interesuje nas dyskretny proces stochastyczny (Yt)t=1,2,….Zaobserwowane wartości tego szeregu oznaczamy: y1, y2,… yn i nazywamy szeregiem czasowym. Możemy rozważać szereg czasowy momentów lub okresów. Dodatkowo zakładamy, że odstępy czasowe są równe.
Zdajemy sobie sprawę z tego, że zaobserwowane wartości Y nie musiały wystąpić, mogły być inne bliskie bądź dalekie od zanotowanych. Obserwowane wartości traktujemy jako pewną realizację procesu stochastycznego. Przyjmujemy następujący model opisu obserwowanego procesu. Przyjmujemy, że jest on wypadkową działania:
a) składowej deterministycznej (składowa systematyczna, przyczyny główne);
b) procesu stochastycznego (przyczyn ubocznych, przypadkowych).
Proces wyznaczania składowych szeregu czasowego nazywamy procesem dekompozycji szeregu czasowego. Proces dekompozycji polega na budowie modelu szeregu czasowego.
Wyróżniamy dwa główne typy modelu szeregu czasowego:
a) addytywny: yt = f(t) + g(t) + h(t) + xt ; t = 1, 2, … n ;
b) multiplikatywny: yt = f(t) × g(t) × h(t) × xt ; t = 1, 2, … n ;
gdzie:
f() – funkcja opisująca trend ;
g() – funkcja opisująca wahania sezonowe ;
h() – funkcja opisująca wahania cykliczne ;
xt – składnik losowy.
Budując model musimy ustalić postać analityczną funkcji f, g, h. Krokiem w kierunku ustalenia postaci funkcji może być analiza graficzna zaobserwowanych wielkości y1, y2¸ … yn i na tej podstawie próba ustalenia postaci funkcji trendu.
Przyjmiemy, że funkcja trendu jest funkcją:
a) liniową, gdy (t, yt) układają się w przybliżeniu wzdłuż linii prostej; (yt = a + bt)
b) wykładniczą, gdy (t, ln(yt)) układają się w przybliżeniu wzdłuż linii prostej; (yt = a × bt)
c) logarytmiczną, gdy (ln(t), yt) układają się w przybliżeniu wzdłuż linii prostej; (yt = a × ln(t))
d) potęgową, gdy (ln(t), ln(yt)) układają się w przybliżeniu wzdłuż linii prostej; (yt = a × tb)
Musimy teraz zweryfikować wybór analitycznej postaci funkcji trendu.
Ad a) Jeśli funkcja trendu ma postać liniową f(t) = a + b×t , to przyrosty są stałe (z dokładnością do składnika losowego):
Dyt = yt – yt-1 = b + (xt - xt-1) ;
Weryfikujemy hipotezę, o stałości przyrostów zakładając liniowość przyrostów: Dyt = a + b×t + et ;
a następnie weryfikując hipotezę zerową H0 , że parametr b różni się od zera w sposób nieistotny.
Ad b) Jeśli funkcja trendu ma postać wykładniczą f(t) = a × bt , to spełniony jest warunek:
( f(t) – f(t-1) ) / f(t-1) = b – 1
A to oznacza, że szereg czasowy ma stałe przyrosty względne (z dokładnością do składnika losowego) lub inaczej mówiąc, że indeksy łańcuchowe dla tego szeregu są stałe z dokładnością do czynnika losowego:
Dyt / yt-1 = const + et ;
Prognozowanie na podstawie trendu.
Rozważmy obecnie modele szeregów czasowych, w których składowa systematyczna ma postać trendu oraz w których występuje składowa losowa. Rozważamy więc modele postaci:
Yt = f(t) + xt – postać addytywna (A)
Yt = f(t) × xt – postać multyplikatywna (M)
dla t = 1, 2, …n
Będziemy dalej zakładać, że f jest funkcją liniową: f(t) = a0 + a1×t
Dodatkowo zakładamy, że :
Tak więc model szeregu czasowego ma postać:
yt = a0 + a1×t + xt , t = 1, 2, … n;
Parametry a0 , a1 są nam nieznane. Musimy je oszacować. Szacujemy za pomocą metody najmniejszych kwadratów. Pamiętamy, że dla jednej zmiennej objaśniającej otrzymaliśmy dwa rodzaje wzorów na oszacowanie parametrów strukturalnych. W klasycznym modelu trendu jako jedyna zmienna objaśniająca pojawia się czas.
Pierwszy komplet wzorów na a 0 , a1 :
gdzie są średnimi arytmetycznymi dla czasu i dla zmiennej objaśnianej odpowiednio.
We wzorze na a1 mamy podane trzy równorzędne wersje prawej strony wzoru, do obliczeń stosujemy tę, która jest najwygodniejsza w użyciu.
Uwaga zachodzą warte zapamiętania równość równości:
Drugi komplet wzorów na a 0 , a1 :
a = [a0 , a1]T = (XTX)-1XTY
W tym przypadku macierz X jest szczególnej postaci i dla podkreślenia tej szczególnej postaci będziemy oznaczać ją T :
XT =
TT =
1
…
2
n
W tym szczególnym przypadku, wzory ogólne upraszczają się:
Szereg czasowy możemy więc przedstawić następująco:
yt = a0 + a1×t + et ; t = 1, 2, … n ;
gdzie a0 , a1 wyznaczone z jednego z kompletów powyższych wzorów
to reszty modelu;
zaś to wartości teoretyczne prognozowanej zmiennej
Model trendu możemy zapisać w postaci macierzowej: y = X a + x
, , , , .
Przez a oznaczmy oszacowanie wektora a za pomocą metodą najmniejszych kwadratów. Wektor a dany jest więc wzorem:
Zachodzi tożsamość:
y = X a + e
gdzie e to wektor reszt: e = y – X a =
zaś to wektor wartości teoretycznych prognozowanej zmiennej.
...
niewmar