Model regresji - Co to jest, definicja i pojęcie
Model regresji to model matematyczny, który ma na celu określenie relacji między zmienną zależną (Y) w odniesieniu do innych zmiennych, zwanych objaśniającymi lub niezależnymi (X).
Model regresji jest często używany w naukach społecznych w celu określenia, czy istnieje związek przyczynowy między zmienną zależną (Y) a zestawem innych zmiennych objaśniających (X). Podobnie model stara się określić, jaki będzie wpływ na zmienną Y w przypadku zmiany zmiennych objaśniających (X).
Na przykład ekonomista może być zainteresowany określeniem relacji między dochodami pracowników a ich poziomem wykształcenia. W tym celu mógłbym przeprowadzić model regresji, w którym zmienną niezależną (Y) będzie dochód pracownika. Jeśli chodzi o zmienne objaśniające (X), należy uwzględnić wszystkie te, które mogłyby wyjaśnić dochód, wśród których są oczywiście wykształcenie, doświadczenie, wykształcenie rodziców itp.
Analiza regresjiKształt modelu regresji
Prosty model regresji ma następującą postać:
Y = A + BX + u
Y = zmienna zależna lub endogeniczna
X = zmienna niezależna lub objaśniająca
A, B = stałe i nieznane parametry
u = składnik błędu, który obejmuje wszystkie inne czynniki, które wpływają na Y, ale nie są uwzględnione w modelu. Można również uchwycić błędy estymacji zmiennej zależnej. Nie można zaobserwować.
Następnie celem modelu regresji będzie oszacowanie wartości A i B z próbki.
Znaczenie zmiennych
Parametr B powinien odzwierciedlać wpływ zmiany X na zmienną Y, gdy pozostałe zmienne objaśniające pozostają stałe (ceteris paribus).
Natomiast parametr A w ogóle nie wpływa na zależność między Y i X. Jest to zatem tylko normalizacja, w której zakłada się, że średnia wartość u będzie wynosić zero.
Na przykład model regresji liniowej zostałby narysowany w następujący sposób:
