Bayesowskie kryterium informacyjne lub kryterium Schwarza to metoda, która skupia się na sumie kwadratów reszt w celu znalezienia liczby opóźnionych okresów p które minimalizują ten model.
Innymi słowy, chcemy znaleźć minimalną liczbę opóźnionych okresów, które uwzględniamy w autoregresji, aby pomóc nam w przewidywaniu zmiennej zależnej.
W ten sposób będziemy mieć kontrolę nad liczbą opóźnionych okresów p które włączamy do regresji. Kiedy przekroczymy ten optymalny poziom, model Schwarz przestanie się zmniejszać i tym samym osiągniemy minimum. Oznacza to, że osiągniemy liczbę opóźnionych okresów p które minimalizują model Schwarz.
Jest również nazywany kryterium informacyjnym Bayesa (BIC).
Zalecane artykuły: autoregresja, suma kwadratów reszt (SCE).
Bayesowski wzór na kryterium informacyjne
Chociaż na pierwszy rzut oka wydaje się to skomplikowaną formułą, przejdziemy przez części, aby ją zrozumieć. Przede wszystkim w sposób ogólny musimy:
- Logarytmy w obu czynnikach wzoru reprezentują marginalny efekt uwzględnienia opóźnionego okresu p więcej w autoregresji.
- N to całkowita liczba obserwacji.
- Formułę możemy podzielić na dwie części: lewą i prawą.
Część po lewej:
Reprezentuje sumę kwadratów reszt (SCE) autoregresjip opóźnione okresy podzielone przez całkowitą liczbę obserwacji (N).
Do oszacowania współczynników używamy zwykłych najmniejszych kwadratów (OLS). Tak więc, gdy uwzględnimy nowe opóźnione okresy, SCE (p) można jedynie utrzymać lub zmniejszyć.
Wówczas wzrost opóźnionego okresu w autoregresji powoduje:
- SCE (p): zmniejsza się lub pozostaje stała.
- Współczynnik determinacji: wzrasta.
- EFEKT CAŁKOWITY: wzrost w opóźnionym okresie powoduje spadek lewej części formuły.
Teraz właściwa część:
(p + 1) reprezentuje całkowitą liczbę współczynników w autoregresji, czyli regresorów z ich opóźnionymi okresami (p) i punkt przecięcia (1).
Wówczas wzrost opóźnionego okresu w autoregresji powoduje:
- (p + 1): wzrasta, ponieważ uwzględniamy opóźniony okres.
- EFEKT CAŁKOWITY: wydłużenie okresu opóźnionego powoduje wzrost właściwej części formuły.
Praktyczny przykład
Przypuszczamy, że chcemy przewidzieć ceny aboutkarnety narciarskie na następny sezon 2020 z 5-letnią próbą, ale nie wiemy, ile okresów opóźnień zastosować: AR (2) czy AR (3)?
- Pobieramy dane i obliczamy logarytmy naturalne cen karnety narciarskie.
1. Oceniamy współczynniki za pomocą OLS i otrzymujemy:
Suma kwadratów reszt (SCE) dla AR (2) = 0,011753112
Współczynnik determinacji dla AR (2) = 0,085
2. Dodajemy jeszcze 1 opóźniony okres, aby zobaczyć, jak zmienia się SCE:
Suma kwadratów reszt dla AR (3) = 0,006805295
Współczynnik determinacji dla AR (3) = 0,47
Widzimy, że gdy dodamy opóźniony okres w autoregresji, w tym przypadku współczynnik determinacji wzrasta, a SCE maleje.
- Obliczamy Bayesowskie kryterium informacyjne:
Im mniejszy model BIC, tym bardziej preferowany model. Wtedy AR (3) byłby preferowanym modelem w stosunku do AR (2), biorąc pod uwagę, że jego współczynnik determinacji jest wyższy, SCE jest niższy, a model Schwarza lub Bayesowskie kryterium informacyjne jest również niższe.