Kendall's Tau (I) - Co to jest, definicja i pojęcie

Spisie treści:

Kendall's Tau (I) - Co to jest, definicja i pojęcie
Kendall's Tau (I) - Co to jest, definicja i pojęcie
Anonim

Jest to nieparametryczna miara zależności, która identyfikuje zgodne i niezgodne pary dwóch zmiennych. Po zidentyfikowaniu sumy są obliczane i sporządzany jest iloraz.

Klasyfikowane korelacje są nieparametryczną alternatywą jako miarą zależności między dwiema zmiennymi, gdy nie możemy zastosować współczynnika korelacji Pearsona.

Innymi słowy, obserwacjom każdej zmiennej przypisujemy ranking i badamy zależność zależności między dwiema danymi zmiennymi. Istnieją dwa sposoby obliczania Tau Kendalla; decydujemy się obliczyć zależność zależności po uporządkowaniu obserwacji każdej zmiennej. W naszym przykładzie zobaczymy, że posortowaliśmy rankingi w kolumnie X w kolejności rosnącej.

Matematycznie,

Definiujemy:

donie = całkowita liczba pasujących par.

NCnie = całkowita liczba niezgodnych (niezgodnych) par.

Procedura i przykład praktyczny

Aby uzyskać Tau Kendalla, musimy najpierw wiedzieć, jak zidentyfikować zgodne i niezgodne pary dwóch zmiennych.

Wykorzystamy preferencje narciarzy. W tym przykładzie zakładamy, że chcemy ocenić, czy narciarze klasyfikują swoje preferencje dla narciarstwa alpejskiego lub narciarstwa biegowego w tej samej kolejności w stacji i. Ich oceny mogą wynosić od 1 (bardzo preferowane) do 7 (bardzo mało preferowane).

Nasze pytanie brzmiałoby: czy istnieje zależność między preferencjami narciarzy zjazdowych i narciarzy biegowych w danych ośrodkach narciarskich?

Definiujemy:

X = ocena narciarzy do narciarstwa alpejskiego w stacji i.

Y = ocena narciarzy do narciarstwa biegowego na stacji i.

C = pary zgodne.

NC = niedopasowane/niezgodne pary.

Ija = ośrodek narciarski i.

Proces

  • Zaczynamy od próbki n = 7 obserwacje ośrodków narciarskich. Każdy rząd tabeli to klasyfikacje podane przez narciarzy. Każda para stacji może być zgodna lub niezgodna. W kolumnach C i NC liczymy pary tylko w jednym kierunku. Na przykład para AB i BA jest liczona jako pojedyncza para, aby uniknąć powtórzeń.

Uzyskane obserwacje to:

Ośrodek narciarski (ja) X Z
DO 1 1
b 2 3
do 3 4
re 4 2
I 5 7
fa 6 6
sol 7 5
  1. Posortowaliśmy elementy kolumny X w porządku rosnącym, aby móc je porównać z elementami kolumny Z
  2. Znajdujemy pary zgodne i pary niezgodne.
Ośrodek narciarski (ja) X Z doNC
DO 1 1 6 0
b 2 3 5 0
do 3 4 5 1
re 4 2 4 0
I 5 7 4 1
fa 6 6 4 1
sol 7 5 43 3 Całkowity
  • Najpierw przyjrzymy się kolumnie Z, ponieważ kolumna X jest już posortowana w porządku rosnącym. W związku z tym wszystkie klasyfikacje w kolumnie Z, które nie rosną, będą niezgodnymi parami stacji.
    • Szukając par stacji (zgodnych i niezgodnych) zawsze będziemy mieli ostatni rząd obserwacji, ponieważ szukamy par (zestawów dwóch obserwacji).
    • Wszystkie te, które są poniżej klasyfikacji referencyjnej, będą parami zgodnymi. W pierwszym przypadku obaj narciarze ustalają klasyfikację referencyjną na 1. Wszystkie klasyfikacje poniżej 1 będą parami zgodnymi z A. W sumie mamy do sklasyfikowania 7 stacji. Tak więc będzie 6 zgodnych par A. Ponieważ nie mamy żadnych niezgodnych par związanych z A, postawimy zero.

Przeczytaj drugą część Tau Kendalla (II)