Kendall's Tau (II) - Co to jest, definicja i pojęcie

Jest to nieparametryczna miara zależności, która identyfikuje zgodne i niezgodne pary dwóch zmiennych. Po zidentyfikowaniu sumy są obliczane i sporządzany jest iloraz.

Innymi słowy, obserwacjom każdej zmiennej przypisujemy ranking i badamy zależność zależności między dwiema danymi zmiennymi.

Istnieją dwa sposoby obliczania Tau Kendalla; decydujemy się obliczyć zależność zależności po uporządkowaniu obserwacji każdej zmiennej. W naszym przykładzie zobaczymy, że sortujemy rankingi w kolumnie X w porządku rosnącym.

Klasyfikowane korelacje są nieparametryczną alternatywą jako miarą zależności między dwiema zmiennymi, gdy nie możemy zastosować współczynnika korelacji Pearsona.

Oto wyniki, do których odnieśliśmy się w pierwszym artykule -> Tau Kendalla (I):

Ośrodek narciarski (ja) X Z do NC
DO 1 1 6 0
b 2 3 5 0
do 3 4 5 1
re 4 2 4 0
I 5 7 4 1
fa 6 6 4 1
sol 7 5 43 3 CAŁKOWITY
  • Para BC-CB jest parą niezgodną. Wpisujemy 1 w kolumnie NC i zamrażamy licznik na ostatniej pozycji, aż ponownie znajdziemy pasującą parę. W tym przypadku zamroziliśmy liczbę pasujących par na 5 do stacji D. Stacja D może utworzyć tylko 4 pasujące pary: AD-DA, DE-ED, DF-FD, DG-GD.

Inną niezgodną parą byłaby EF-FE:

  • Para EF-FE jest parą niezgodną. Piszemy 1 w kolumnie NC i kontynuujemy przeciąganie liczby 4 zgodnych par, które można utworzyć. Pasujące pary stacji E to: EA-AE, EB-BE, EC-CE, ED-DE, ponieważ EF-FE jest niezgodne.
    • Para FG-GF jest parą niezgodną. Piszemy 1 w kolumnie NC i kontynuujemy przeciąganie liczby 4 zgodnych par, które można utworzyć. Pary zgodne stacji F s (nie zmienialiśmy zamiast 4. Pary zgodne, które mogliśmy pokazać wcześniej (nie zmienialiśmy: FA-AF, FB-BF, FC-CF, FD-DF ponieważ FG-GF jest zgrzytliwy.

Obliczamy Tau . Kendalla

Tau Kendalla nie ma żadnej tajemnicy poza byciem ilorazem par zgodnych i niezgodnych próbki obserwacji.

Interpretacja

Nasze początkowe pytanie brzmiało: czy istnieje zależność pomiędzy preferencjami narciarzy zjazdowych i narciarzy biegowych w danych ośrodkach narciarskich?

W tym przypadku mamy zależność między dwiema zmiennymi wynoszącą 0,8695. Wynik bardzo bliski górnej granicy. Wynik ten mówi nam, że narciarze alpejscy (X) i narciarze nordyccy (Z) sklasyfikowali ośrodki o podobnej klasyfikacji.

Bez konieczności wykonywania jakichkolwiek obliczeń widzimy, że pierwsze stacje (A, B, C) otrzymują najlepsze wyniki z obu grup. Innymi słowy, oceny narciarzy podążają w tym samym kierunku.

Porównanie: Pearson kontra Kendall

Jeśli obliczymy współczynnik korelacji Pearsona na podstawie poprzednich obserwacji i porównamy go z Tau Kendalla, otrzymamy:

W tym przypadku Tau Kendalla mówi nam, że istnieje silniejsza zależność zależności między zmiennymi X i Z w porównaniu ze współczynnikiem korelacji Pearsona: 0,8695> 0,75.

Gdyby wartości odstające miały duży wpływ na wyniki, znaleźlibyśmy dużą różnicę między Pearsonem a Spearmanem i dlatego powinniśmy używać Spearmana jako miary zależności.