Bayesowskie kryterium informacyjne

Bayesowskie kryterium informacyjne lub kryterium Schwarza to metoda, która skupia się na sumie kwadratów reszt w celu znalezienia liczby opóźnionych okresów p które minimalizują ten model.

Innymi słowy, chcemy znaleźć minimalną liczbę opóźnionych okresów, które uwzględniamy w autoregresji, aby pomóc nam w przewidywaniu zmiennej zależnej.

W ten sposób będziemy mieć kontrolę nad liczbą opóźnionych okresów p które włączamy do regresji. Kiedy przekroczymy ten optymalny poziom, model Schwarz przestanie się zmniejszać i tym samym osiągniemy minimum. Oznacza to, że osiągniemy liczbę opóźnionych okresów p które minimalizują model Schwarz.

Jest również nazywany kryterium informacyjnym Bayesa (BIC).

Zalecane artykuły: autoregresja, suma kwadratów reszt (SCE).

Bayesowski wzór na kryterium informacyjne

Chociaż na pierwszy rzut oka wydaje się to skomplikowaną formułą, przejdziemy przez części, aby ją zrozumieć. Przede wszystkim w sposób ogólny musimy:

  • Logarytmy w obu czynnikach wzoru reprezentują marginalny efekt uwzględnienia opóźnionego okresu p więcej w autoregresji.
  • N to całkowita liczba obserwacji.
  • Formułę możemy podzielić na dwie części: lewą i prawą.

Część po lewej:

Reprezentuje sumę kwadratów reszt (SCE) autoregresjip opóźnione okresy podzielone przez całkowitą liczbę obserwacji (N).

Do oszacowania współczynników używamy zwykłych najmniejszych kwadratów (OLS). Tak więc, gdy uwzględnimy nowe opóźnione okresy, SCE (p) można jedynie utrzymać lub zmniejszyć.

Wówczas wzrost opóźnionego okresu w autoregresji powoduje:

  • SCE (p): zmniejsza się lub pozostaje stała.
  • Współczynnik determinacji: wzrasta.
  • EFEKT CAŁKOWITY: wzrost w opóźnionym okresie powoduje spadek lewej części formuły.

Teraz właściwa część:

(p + 1) reprezentuje całkowitą liczbę współczynników w autoregresji, czyli regresorów z ich opóźnionymi okresami (p) i punkt przecięcia (1).

Wówczas wzrost opóźnionego okresu w autoregresji powoduje:

  • (p + 1): wzrasta, ponieważ uwzględniamy opóźniony okres.
  • EFEKT CAŁKOWITY: wydłużenie okresu opóźnionego powoduje wzrost właściwej części formuły.

Praktyczny przykład

Przypuszczamy, że chcemy przewidzieć ceny aboutkarnety narciarskie na następny sezon 2020 z 5-letnią próbą, ale nie wiemy, ile okresów opóźnień zastosować: AR (2) czy AR (3)?

  • Pobieramy dane i obliczamy logarytmy naturalne cen karnety narciarskie.

1. Oceniamy współczynniki za pomocą OLS i otrzymujemy:

Suma kwadratów reszt (SCE) dla AR (2) = 0,011753112

Współczynnik determinacji dla AR (2) = 0,085

2. Dodajemy jeszcze 1 opóźniony okres, aby zobaczyć, jak zmienia się SCE:

Suma kwadratów reszt dla AR (3) = 0,006805295

Współczynnik determinacji dla AR (3) = 0,47

Widzimy, że gdy dodamy opóźniony okres w autoregresji, w tym przypadku współczynnik determinacji wzrasta, a SCE maleje.

  • Obliczamy Bayesowskie kryterium informacyjne:

Im mniejszy model BIC, tym bardziej preferowany model. Wtedy AR (3) byłby preferowanym modelem w stosunku do AR (2), biorąc pod uwagę, że jego współczynnik determinacji jest wyższy, SCE jest niższy, a model Schwarza lub Bayesowskie kryterium informacyjne jest również niższe.

Będziesz pomóc w rozwoju serwisu, dzieląc stronę ze swoimi znajomymi

wave wave wave wave wave