Skorygowane R do kwadratu (skorygowany współczynnik determinacji)

Spisie treści:

Skorygowane R do kwadratu (skorygowany współczynnik determinacji)
Skorygowane R do kwadratu (skorygowany współczynnik determinacji)
Anonim

Skorygowany R-kwadrat (lub skorygowany współczynnik determinacji) jest używany w regresji wielokrotnej, aby zobaczyć stopień intensywności lub skuteczności zmiennych niezależnych w wyjaśnianiu zmiennej zależnej.

Mówiąc prościej, skorygowana R-kwadrat mówi nam, jaki procent zmienności zmiennej zależnej jest wspólnie wyjaśniany przez wszystkie zmienne niezależne.

Zastosowanie tego współczynnika jest uzasadnione tym, że gdy dodajemy zmienne do regresji, nieskorygowany współczynnik determinacji ma tendencję do wzrostu. Nawet jeśli marginalny wkład każdej z nowo dodanych zmiennych nie ma znaczenia statystycznego.

Dlatego dodając zmienne do modelu, współczynnik determinacji mógłby wzrosnąć i moglibyśmy błędnie sądzić, że wybrany zestaw zmiennych jest w stanie wyjaśnić większą część zmienności zmiennej niezależnej. Ten problem jest powszechnie znany jako „przeszacowanie modelu”.

Współczynnik zmiennościAnaliza regresji

Skorygowany współczynnik wzoru determinacji

Aby rozwiązać opisany powyżej problem, wielu badaczy sugeruje skorygowanie współczynnika determinacji za pomocą następującego wzoru:

R2 do → Skorygowany R do kwadratu lub skorygowany współczynnik determinacji

R2 → R kwadrat lub współczynnik determinacji

nie → Liczba obserwacji w próbie

k → Liczba zmiennych niezależnych

Biorąc pod uwagę, że 1-R2 jest liczbą stałą, a ponieważ n jest większe od k, gdy dodajemy zmienne do modelu, iloraz w nawiasach staje się większy. W konsekwencji. również wynik pomnożenia tego przez 1-R2 . Dzięki temu widzimy, że formuła jest zbudowana w celu dostosowania i karania włączenia współczynników do modelu.

Poza poprzednią zaletą korekta zastosowana w poprzednim wzorze pozwala nam również na porównywanie modeli o różnej liczbie zmiennych niezależnych. Formuła ponownie dostosowuje liczbę zmiennych między jednym a drugim modelem i pozwala na jednorodne porównanie.

Wracając do poprzedniego wzoru, możemy wywnioskować, że skorygowany współczynnik determinacji będzie zawsze równy lub mniejszy niż współczynnik R2. W przeciwieństwie do współczynnika determinacji, który waha się od 0 do 1, skorygowany współczynnik determinacji może być ujemny z dwóch powodów:

  • Im bliżej k zbliża się do n.
  • Im niższy współczynnik determinacji.
Współczynnik korelacji liniowej