Jest to nieparametryczna miara zależności, która identyfikuje zgodne i niezgodne pary dwóch zmiennych. Po zidentyfikowaniu sumy są obliczane i sporządzany jest iloraz.
Klasyfikowane korelacje są nieparametryczną alternatywą jako miarą zależności między dwiema zmiennymi, gdy nie możemy zastosować współczynnika korelacji Pearsona.
Innymi słowy, obserwacjom każdej zmiennej przypisujemy ranking i badamy zależność zależności między dwiema danymi zmiennymi. Istnieją dwa sposoby obliczania Tau Kendalla; decydujemy się obliczyć zależność zależności po uporządkowaniu obserwacji każdej zmiennej. W naszym przykładzie zobaczymy, że posortowaliśmy rankingi w kolumnie X w kolejności rosnącej.
Matematycznie,
Definiujemy:
donie = całkowita liczba pasujących par.
NCnie = całkowita liczba niezgodnych (niezgodnych) par.
Procedura i przykład praktyczny
Aby uzyskać Tau Kendalla, musimy najpierw wiedzieć, jak zidentyfikować zgodne i niezgodne pary dwóch zmiennych.
Wykorzystamy preferencje narciarzy. W tym przykładzie zakładamy, że chcemy ocenić, czy narciarze klasyfikują swoje preferencje dla narciarstwa alpejskiego lub narciarstwa biegowego w tej samej kolejności w stacji i. Ich oceny mogą wynosić od 1 (bardzo preferowane) do 7 (bardzo mało preferowane).
Nasze pytanie brzmiałoby: czy istnieje zależność między preferencjami narciarzy zjazdowych i narciarzy biegowych w danych ośrodkach narciarskich?
Definiujemy:
X = ocena narciarzy do narciarstwa alpejskiego w stacji i.
Y = ocena narciarzy do narciarstwa biegowego na stacji i.
C = pary zgodne.
NC = niedopasowane/niezgodne pary.
Ija = ośrodek narciarski i.
Proces
- Zaczynamy od próbki n = 7 obserwacje ośrodków narciarskich. Każdy rząd tabeli to klasyfikacje podane przez narciarzy. Każda para stacji może być zgodna lub niezgodna. W kolumnach C i NC liczymy pary tylko w jednym kierunku. Na przykład para AB i BA jest liczona jako pojedyncza para, aby uniknąć powtórzeń.
Uzyskane obserwacje to:
Ośrodek narciarski (ja) | X | Z |
DO | 1 | 1 |
b | 2 | 3 |
do | 3 | 4 |
re | 4 | 2 |
I | 5 | 7 |
fa | 6 | 6 |
sol | 7 | 5 |
- Posortowaliśmy elementy kolumny X w porządku rosnącym, aby móc je porównać z elementami kolumny Z
- Znajdujemy pary zgodne i pary niezgodne.
Ośrodek narciarski (ja) | X | Z | do | NC | |
DO | 1 | 1 | 6 | 0 | |
b | 2 | 3 | 5 | 0 | |
do | 3 | 4 | 5 | 1 | |
re | 4 | 2 | 4 | 0 | |
I | 5 | 7 | 4 | 1 | |
fa | 6 | 6 | 4 | 1 | |
sol | 7 | 5 | 43 | 3 | Całkowity |
- Najpierw przyjrzymy się kolumnie Z, ponieważ kolumna X jest już posortowana w porządku rosnącym. W związku z tym wszystkie klasyfikacje w kolumnie Z, które nie rosną, będą niezgodnymi parami stacji.
- Szukając par stacji (zgodnych i niezgodnych) zawsze będziemy mieli ostatni rząd obserwacji, ponieważ szukamy par (zestawów dwóch obserwacji).
- Wszystkie te, które są poniżej klasyfikacji referencyjnej, będą parami zgodnymi. W pierwszym przypadku obaj narciarze ustalają klasyfikację referencyjną na 1. Wszystkie klasyfikacje poniżej 1 będą parami zgodnymi z A. W sumie mamy do sklasyfikowania 7 stacji. Tak więc będzie 6 zgodnych par A. Ponieważ nie mamy żadnych niezgodnych par związanych z A, postawimy zero.
Przeczytaj drugą część Tau Kendalla (II)