Twierdzenie Gaussa-Markowa - Co to jest, definicja i pojęcie

Spisie treści:

Anonim

Twierdzenie Gaussa-Markowa jest zbiorem założeń, które musi spełnić estymator OLS (zwykłe najmniejsze kwadraty), aby można go było uznać za ELIO (Optymalny liniowy estymator nieobciążony). ITwierdzenie Gaussa-Markowa zostało sformułowane przez Carla Friedericha Gaussa i Andrieja Markowa.

Carl Friederich Gauss i Andréi Márkov ustalili pewne założenia, aby estymator OLS mógł stać się ELIO.

Jeśli te 5 założeń jest spełnionych, możemy stwierdzić, że estymator jest tym, który ma minimalną wariancję (najdokładniej) ze wszystkich estymatorów liniowych i nieobciążonych. W przypadku niepowodzenia któregokolwiek z pierwszych trzech założeń (liniowość, zerowa średnia-ścisła egzogeniczność lub brak doskonałej wielokolinearności), estymator MNK nie jest już bezstronny. Jeśli zawiedzie tylko 4 lub 5 (homoskedastyczność i brak autokorelacji), estymator jest nadal liniowy i nieobciążony, ale nie jest już najdokładniejszy. Podsumowując, twierdzenie Gaussa-Markowa stwierdza, że:

  • Przy założeniach 1, 2 i 3 estymator MNK jest liniowy i nieobciążony. Teraz, dopóki nie zostaną spełnione pierwsze trzy założenia, można mieć pewność, że estymator jest bezstronny. Aby estymator był spójny, musimy mieć dużą próbkę, im więcej, tym lepiej.
  • Przy założeniach 1, 2, 3, 4 i 5 estymator MNK jest liniowy, nieobciążony i optymalny (ELIO).

Założenia twierdzenia Gaussa-Markowa

W szczególności istnieje 5 założeń:

1. Model liniowy w parametrach

To dość elastyczne założenie. Pozwala na wykorzystanie funkcji interesujących zmiennych.

2. Zerowa średnia i ścisła egzogeniczność

Oznacza to, że średnia wartość błędu uwarunkowanego wyjaśnieniami jest równa bezwarunkowej wartości oczekiwanej i jest równa zeru. Ponadto ścisła egzogeniczność wymaga, aby błędy modelu nie były skorelowane z żadnymi obserwacjami.

Wartość zerowa:

Ścisła egzogeniczność:

Zerowa średnia i ścisła egzogeniczność zawodzą, jeśli:

  • Model jest słabo sprecyzowany (np. pominięcie odpowiednich zmiennych).
  • W zmiennych występują błędy pomiaru (dane nie zostały przeanalizowane).
  • W szeregach czasowych ścisła egzogeniczność zawodzi w modelach opóźnionej endogeniczności (chociaż może istnieć równoczesna egzogeniczność) oraz w przypadkach, w których występują efekty sprzężenia zwrotnego.

W danych przekrojowych znacznie łatwiej jest osiągnąć założenie egzogeniczności niż w przypadku szeregów czasowych.

3. Brak dokładnej współliniowości

W próbie żadna ze zmiennych objaśniających nie jest stała. Nie ma dokładnych zależności liniowych między zmiennymi objaśniającymi. Nie wyklucza to pewnej (niedoskonałej) korelacji między zmiennymi. Według Gaussa i Markowa, kiedy model ma dokładną wielowspółliniowość, jest to zwykle spowodowane błędem analityka.

4. Homoskedastyczność

Wariancja błędu, a więc i Y, jest niezależna od wartości objaśniających i dodatkowo od wariancji błędu stałego. Matematycznie wyraża się to jako:

Oto seria danych o wyglądzie homoskedastycznym.

5. Brak autokorelacji

Warunki błędu dwóch różnych obserwacji uzależnionych od X nie są powiązane. Jeśli próbka jest losowa, nie będzie autokorelacji.

Gdzie muszę mieć inną wartość od h. Jeśli próbka jest losowa, dane i błędy obserwacji „i” i „h” będą niezależne dla dowolnej pary obserwacji „i” i „h”.