Modele wyboru binarnego
Modele wyboru binarnego to modele, w których zmienna zależna przyjmuje tylko dwie wartości: 1 oznaczającą „sukces” lub „0” oznaczającą niepowodzenie. Konkretne modele estymacji to: prawdopodobieństwo liniowe, logit i probit.
W modelu regresji prostej lub wielokrotnej, który jest nauczany na kursie wprowadzającym Ekonometria, zmienna zależna ma zwykle interpretację ekonomiczną (taką jak wzrost PKB, inwestycji lub konsumpcji) na podstawie innych zmiennych objaśniających.
Ale jakiego modelu używamy, gdy chcemy wyjaśnić zdarzenia, które mają tylko dwie możliwości? Na przykład: zaliczenie przedmiotu lub jego niezaliczenie, ukończenie lub nieukończenie studiów, bycie zatrudnionym lub bezrobotnym itp. Na to reagują modele wyboru binarnego.
W każdym z tych przypadków możesz zrobić Tak = 1 oznacza „sukces”; Tak = 0 oznaczają „porażkę”. Z tego powodu nazywa się je modelami wyboru binarnego, a równanie, którego używa, wygląda następująco:

W ten sposób uzyskamy prawdopodobieństwo powodzenia danej zmiennej.
Jak dotąd nie ma większych komplikacji. Jednak oszacowanie i interpretacja parametrów wymaga większej staranności.
Model regresjiModele do estymacji parametrów binarnych
Biorąc pod uwagę powyższe cechy zmiennej niezależnej, istnieją trzy modele szacowania parametrów:
- Liniowy model prawdopodobieństwa. Jest obliczany za pomocą normalnego OLS.
- Model logitowy. Jest obliczany za pomocą standardowej funkcji dystrybucji logistycznej.
- Model probitowy. Jest obliczany za pomocą standardowej funkcji rozkładu normalnego.
Liniowy model prawdopodobieństwa
Liniowy model prawdopodobieństwa (MPL) jest tak nazwany, ponieważ prawdopodobieństwo
odpowiedź jest liniowa w stosunku do parametrów równania. Do estymacji użyj zwykłych najmniejszych kwadratów (OLS)
Oszacowane równanie jest napisane

Zmienna niezależna (i kapelusz) to przewidywane prawdopodobieństwo sukcesu.
B0 cap to przewidywane prawdopodobieństwo sukcesu, gdy każdy z x jest równy zero. Współczynnik B1 cap mierzy zmienność przewidywanego prawdopodobieństwa sukcesu, gdy x1 zwiększa jedną jednostkę.Aby poprawnie zinterpretować liniowy model prawdopodobieństwa, musimy wziąć pod uwagę, co jest uważane za sukces, a co nie.
Przykład binarnego modelu wyboru
Ekonomista Jeffrey Wooldridge oszacował model ekonometryczny, w którym zmienna binarna wskazuje, czy zamężna kobieta uczestniczyła w sile roboczej (zmienna objaśniona) w 1975 roku. Tak = 1 oznaczało, że uczestniczyłem Tak = 0, które nie.
W modelu wykorzystano poziom dochodów męża jako zmienne objaśniające (hinc), lata edukacji (edukować), wieloletnie doświadczenie na rynku pracy (ekspert), wiek (wiek), liczba dzieci poniżej szóstego roku życia (dzieciaki6) oraz liczbę dzieci w wieku od 6 do 18 lat (dzieciaki6).

Możemy zweryfikować, że wszystkie zmienne z wyjątkiem kidsge6 są statystycznie istotne i wszystkie istotne zmienne mają oczekiwany efekt.
Teraz interpretacja parametrów wygląda tak:
- Jeśli zwiększysz jeden rok nauki, ceteris paribus, prawdopodobieństwo wejścia na rynek pracy wzrasta o 3,8%.
- Jeśli doświadczenie wzrośnie w ciągu jednego roku, prawdopodobieństwo bycia częścią siły roboczej wzrasta o 3,9%.
- Jeśli masz dziecko w wieku poniżej 6 lat, ceteris paribus, prawdopodobieństwo bycia częścią siły roboczej spada o 26,2%.
Widzimy więc, że ten model mówi nam o wpływie każdej sytuacji na prawdopodobieństwo formalnego zatrudnienia kobiety.
Model ten można wykorzystać do oceny polityk publicznych i programów społecznych, ponieważ zmianę „przewidywanego prawdopodobieństwa sukcesu” można skwantyfikować w odniesieniu do jednostkowych lub marginalnych zmian zmiennych objaśniających.
Wady liniowego modelu prawdopodobieństwa
Jednak ten model ma dwie główne wady:
- Może dawać prawdopodobieństwa mniejsze od zera i większe od jedności, co nie ma sensu w interpretacji tych wartości.
- Efekty cząstkowe są zawsze stałe. W tym modelu nie ma różnicy między przejściem od zera do jednego dziecka, a przejściem od dwójki do trójki dzieci.
- Ponieważ zmienna objaśniająca przyjmuje tylko wartości zero lub jeden, można wygenerować heteroskedastyczność. Do rozwiązania tego służą błędy standardowe.
Aby rozwiązać dwa pierwsze problemy, które są najważniejsze w liniowym modelu prawdopodobieństwa, zaprojektowano modele Logit i Probit.
Bibliografia:
Wooldridge, J. (2010) Wprowadzenie do ekonometrii. (4th ed.) Meksyk: Cengage Learning.