Prosta funkcja autokorelacji - przykład w R

Innymi słowy, prosta funkcja autokorelacji (FAS) lub z języka angielskiego, Funkcja autokorelacji, Jest to funkcja matematyczna, która pomaga nam zorientować się, jak bardzo dane z danego okresu są zależne od tych samych danych z k poprzednich okresów.

Generujemy roczny szereg czasowy X, który ma rozkład normalny plus bezwładność. Możemy również korzystać z prawdziwych danych.

Metodologia

Programy są niezbędne do pracy nad analizą autokorelacji. Można używać programów takich jak Python, ale do analizy statystycznej i zarządzania danymi zalecamy R lub jego ulepszoną wersję, R Studio. Tutaj będziemy pracować z R.

Obliczenie

A jak piszemy formułę FAS w kodzie R?

Zarówno R, jak i Python mają biblioteki, w których formuły są powiązane z nazwą. Wtedy wystarczy, że zainstalowaliśmy bibliotekę zawierającą formułę, której chcemy użyć i wywołamy ją w skrypcie.

W quion R musimy napisać:

Funkcja acf jest w bibliotece statystyki.

X -> Szeregi czasowe, których używamy jako próbki do obliczenia FAS.

acf (X, ylim = c (-1,1)) -> Prosta funkcja autokorelacji na X z limitami na osi pionowej między -1 a 1, które są wartościami, które może przyjąć współczynnik autokorelacji.

Weryfikacja

Ten krok nie jest konieczny, jeśli użyliśmy poprzedniego kodu, ponieważ sam oblicza przedziały ufności.

Aby określić, czy obliczone współczynniki autokorelacji są statystycznie istotne, będziemy musieli ustalić przedziały ufności z wartościami krytycznymi. W ten sposób, mając procent istotności, możemy ze statystyczną pewnością stwierdzić, czy w danych występuje autokorelacja.

W taki sam sposób jak współczynnik korelacji, współczynnik autokorelacji również zakłada normalność i dlatego obliczymy przedział ufności w następujący sposób:

Testowanie hipotez definiujemy jako:

Przy 95% ufności i poziomie istotności 5% znajdujemy słynne 1,96 w normalnych tabelach. Wartość krytyczną określa:

Gdzie wariancję współczynników podaje się przez przybliżenie:

Chociaż podajemy wzór, zalecamy używanie programów statystycznych dla większej precyzji i szybkości.

Wynik

Wszystkie linie kończące się poza przedziałem ufności oznaczają, że szeregi czasowe wykazują autokorelację we wskazanym okresie.

Tak więc na podstawie wykresu widzimy, że w tym szeregu czasowym występuje autokorelacja w okresach, w których linia wystaje z nieciągłego pasma.

Pierwsza linia, która jest na 0 i odpala w kierunku 1, może zostać zignorowana, ponieważ t musi być ściśle większe od 0, aw tym przypadku tak nie jest. Nie ma sensu wykonywać wszystkich poprzednich kroków, aby poznać autokorelację teraźniejszości z teraźniejszością, ponieważ już to znamy: korelacja zmiennej ze sobą wynosi 1, więc już mamy odpowiedź.