Twierdzenie Gaussa-Markowa jest zbiorem założeń, które musi spełnić estymator OLS (zwykłe najmniejsze kwadraty), aby można go było uznać za ELIO (Optymalny liniowy estymator nieobciążony). ITwierdzenie Gaussa-Markowa zostało sformułowane przez Carla Friedericha Gaussa i Andrieja Markowa.
Carl Friederich Gauss i Andréi Márkov ustalili pewne założenia, aby estymator OLS mógł stać się ELIO.
Jeśli te 5 założeń jest spełnionych, możemy stwierdzić, że estymator jest tym, który ma minimalną wariancję (najdokładniej) ze wszystkich estymatorów liniowych i nieobciążonych. W przypadku niepowodzenia któregokolwiek z pierwszych trzech założeń (liniowość, zerowa średnia-ścisła egzogeniczność lub brak doskonałej wielokolinearności), estymator MNK nie jest już bezstronny. Jeśli zawiedzie tylko 4 lub 5 (homoskedastyczność i brak autokorelacji), estymator jest nadal liniowy i nieobciążony, ale nie jest już najdokładniejszy. Podsumowując, twierdzenie Gaussa-Markowa stwierdza, że:
- Przy założeniach 1, 2 i 3 estymator MNK jest liniowy i nieobciążony. Teraz, dopóki nie zostaną spełnione pierwsze trzy założenia, można mieć pewność, że estymator jest bezstronny. Aby estymator był spójny, musimy mieć dużą próbkę, im więcej, tym lepiej.
- Przy założeniach 1, 2, 3, 4 i 5 estymator MNK jest liniowy, nieobciążony i optymalny (ELIO).
Założenia twierdzenia Gaussa-Markowa
W szczególności istnieje 5 założeń:
1. Model liniowy w parametrach
To dość elastyczne założenie. Pozwala na wykorzystanie funkcji interesujących zmiennych.
2. Zerowa średnia i ścisła egzogeniczność
Oznacza to, że średnia wartość błędu uwarunkowanego wyjaśnieniami jest równa bezwarunkowej wartości oczekiwanej i jest równa zeru. Ponadto ścisła egzogeniczność wymaga, aby błędy modelu nie były skorelowane z żadnymi obserwacjami.
Wartość zerowa:
Ścisła egzogeniczność:
Zerowa średnia i ścisła egzogeniczność zawodzą, jeśli:
- Model jest słabo sprecyzowany (np. pominięcie odpowiednich zmiennych).
- W zmiennych występują błędy pomiaru (dane nie zostały przeanalizowane).
- W szeregach czasowych ścisła egzogeniczność zawodzi w modelach opóźnionej endogeniczności (chociaż może istnieć równoczesna egzogeniczność) oraz w przypadkach, w których występują efekty sprzężenia zwrotnego.
W danych przekrojowych znacznie łatwiej jest osiągnąć założenie egzogeniczności niż w przypadku szeregów czasowych.
3. Brak dokładnej współliniowości
W próbie żadna ze zmiennych objaśniających nie jest stała. Nie ma dokładnych zależności liniowych między zmiennymi objaśniającymi. Nie wyklucza to pewnej (niedoskonałej) korelacji między zmiennymi. Według Gaussa i Markowa, kiedy model ma dokładną wielowspółliniowość, jest to zwykle spowodowane błędem analityka.
4. Homoskedastyczność
Wariancja błędu, a więc i Y, jest niezależna od wartości objaśniających i dodatkowo od wariancji błędu stałego. Matematycznie wyraża się to jako:
Oto seria danych o wyglądzie homoskedastycznym.
5. Brak autokorelacji
Warunki błędu dwóch różnych obserwacji uzależnionych od X nie są powiązane. Jeśli próbka jest losowa, nie będzie autokorelacji.
Gdzie muszę mieć inną wartość od h. Jeśli próbka jest losowa, dane i błędy obserwacji „i” i „h” będą niezależne dla dowolnej pary obserwacji „i” i „h”.