Jest to nieparametryczna miara zależności, która identyfikuje zgodne i niezgodne pary dwóch zmiennych. Po zidentyfikowaniu sumy są obliczane i sporządzany jest iloraz.
Innymi słowy, obserwacjom każdej zmiennej przypisujemy ranking i badamy zależność zależności między dwiema danymi zmiennymi.
Istnieją dwa sposoby obliczania Tau Kendalla; decydujemy się obliczyć zależność zależności po uporządkowaniu obserwacji każdej zmiennej. W naszym przykładzie zobaczymy, że sortujemy rankingi w kolumnie X w porządku rosnącym.
Klasyfikowane korelacje są nieparametryczną alternatywą jako miarą zależności między dwiema zmiennymi, gdy nie możemy zastosować współczynnika korelacji Pearsona.
Oto wyniki, do których odnieśliśmy się w pierwszym artykule -> Tau Kendalla (I):
Ośrodek narciarski (ja) | X | Z | do | NC | |
DO | 1 | 1 | 6 | 0 | |
b | 2 | 3 | 5 | 0 | |
do | 3 | 4 | 5 | 1 | |
re | 4 | 2 | 4 | 0 | |
I | 5 | 7 | 4 | 1 | |
fa | 6 | 6 | 4 | 1 | |
sol | 7 | 5 | 43 | 3 | CAŁKOWITY |
- Para BC-CB jest parą niezgodną. Wpisujemy 1 w kolumnie NC i zamrażamy licznik na ostatniej pozycji, aż ponownie znajdziemy pasującą parę. W tym przypadku zamroziliśmy liczbę pasujących par na 5 do stacji D. Stacja D może utworzyć tylko 4 pasujące pary: AD-DA, DE-ED, DF-FD, DG-GD.
Inną niezgodną parą byłaby EF-FE:
- Para EF-FE jest parą niezgodną. Piszemy 1 w kolumnie NC i kontynuujemy przeciąganie liczby 4 zgodnych par, które można utworzyć. Pasujące pary stacji E to: EA-AE, EB-BE, EC-CE, ED-DE, ponieważ EF-FE jest niezgodne.
- Para FG-GF jest parą niezgodną. Piszemy 1 w kolumnie NC i kontynuujemy przeciąganie liczby 4 zgodnych par, które można utworzyć. Pary zgodne stacji F s (nie zmienialiśmy zamiast 4. Pary zgodne, które mogliśmy pokazać wcześniej (nie zmienialiśmy: FA-AF, FB-BF, FC-CF, FD-DF ponieważ FG-GF jest zgrzytliwy.
Obliczamy Tau . Kendalla
Tau Kendalla nie ma żadnej tajemnicy poza byciem ilorazem par zgodnych i niezgodnych próbki obserwacji.
Interpretacja
Nasze początkowe pytanie brzmiało: czy istnieje zależność pomiędzy preferencjami narciarzy zjazdowych i narciarzy biegowych w danych ośrodkach narciarskich?
W tym przypadku mamy zależność między dwiema zmiennymi wynoszącą 0,8695. Wynik bardzo bliski górnej granicy. Wynik ten mówi nam, że narciarze alpejscy (X) i narciarze nordyccy (Z) sklasyfikowali ośrodki o podobnej klasyfikacji.
Bez konieczności wykonywania jakichkolwiek obliczeń widzimy, że pierwsze stacje (A, B, C) otrzymują najlepsze wyniki z obu grup. Innymi słowy, oceny narciarzy podążają w tym samym kierunku.
Porównanie: Pearson kontra Kendall
Jeśli obliczymy współczynnik korelacji Pearsona na podstawie poprzednich obserwacji i porównamy go z Tau Kendalla, otrzymamy:
W tym przypadku Tau Kendalla mówi nam, że istnieje silniejsza zależność zależności między zmiennymi X i Z w porównaniu ze współczynnikiem korelacji Pearsona: 0,8695> 0,75.
Gdyby wartości odstające miały duży wpływ na wyniki, znaleźlibyśmy dużą różnicę między Pearsonem a Spearmanem i dlatego powinniśmy używać Spearmana jako miary zależności.