Rho Spearmana - Co to jest, definicja i pojęcie

Rho Spearmana jest nieparametryczną miarą zależności, w której obliczana jest średnia hierarchia obserwacji, różnice są podnoszone do kwadratu i włączane do wzoru.

Innymi słowy, obserwacjom każdej zmiennej przypisujemy ranking i badamy zależność zależności między dwiema danymi zmiennymi.

Klasyfikowane korelacje są nieparametryczną alternatywą jako miarą zależności między dwiema zmiennymi, gdy nie możemy zastosować współczynnika korelacji Pearsona.

Generalnie przypisywana jest litera giega rho do współczynnika korelacji.

Szacunek rho Spearmana podaje wzór:

Procedura Rho Spearmana

0. Zaczynamy od próbki nie obserwacje (Aja, Bja).

1. Sklasyfikuj obserwacje każdej zmiennej, dostosowując je do powiązań.

  • Używamy funkcji Excela, która klasyfikuje dla nas obserwacje i automatycznie je dostosowuje, jeśli znajdzie powiązania między elementami. Ta funkcja nazywa się HERARCH.MEDIA (klasyfikacja Aja; klasyfikacjanie;zamówienie).
  • Ostatni czynnik funkcji jest opcjonalny i mówi nam, w jakiej kolejności chcemy uporządkować obserwacje. Liczba różna od zera posortuje obserwacje w kolejności rosnącej. Na przykład przypisze najmniejszemu elementowi rangę 1. Jeśli w zmiennej umieścimy zero zamówienie, przypisze największej pozycji rangę 1 (w porządku malejącym).

Praktyczny przykład

  • W naszym przypadku przypisujemy zmiennej kolejności niezerową liczbę, aby uporządkować obserwacje w kolejności rosnącej. Czyli przypisanie najmniejszemu elementowi zmiennej rangi 1.
  • Sprawdzamy, czy łączne sumy kolumn Klasyfikacja A Tak Klasyfikacja B są sobie równe i spełniają:

W tym przypadku n = 10 bo mamy w sumie 10 elementów / obserwacji w każdej zmiennej DO Tak b.

Łączna suma Klasyfikacji A jest równa całkowitej sumie Klasyfikacji Y i spełniają również powyższy wzór.

DO b Klasyfikacja A Klasyfikacja B Kwadratowe różnice
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Całkowity 55 55 130

2. Dodaj różnice między rankingami i podnieś je do kwadratu.

  • Gdy mamy już wszystkie sklasyfikowane obserwacje z uwzględnieniem powiązań między nimi, obliczamy różnicę w postaci:

reja = Aja - Bja

Definiujemy (dja) jako różnica między klasyfikacją Aja i klasyfikacja Bja.

  • Po uzyskaniu różnicy podwajamy ją do kwadratu. Zastosowano kwadraty różnic, które mają tylko wartości dodatnie.

Definiujemy dja2 jako kwadrat różnicy między klasyfikacją Aja i klasyfikacja Bja.

W kolumnie kwadratów różnic będziemy mieli:

reja2 = (Aja - Bja)2

3. Oblicz rho Spearmana:

  • Obliczamy całkowitą sumę kwadratów różnic formularza:

W naszym przykładzie:

  • Wynik włączamy do wzoru rho Spearmana:

W naszym przykładzie:

Porównanie: Pearson kontra Spearman

Jeśli obliczymy współczynnik korelacji Pearsona na podstawie poprzednich obserwacji i porównamy go ze współczynnikiem korelacji Spearmana, otrzymamy:

  • Pearsona = 0,1109
  • Włócznik = 0,2121

Widzimy, że zależność między zmiennymi A i B pozostaje słaba nawet przy użyciu Spearmana zamiast Pearsona.

Gdyby wartości odstające miały duży wpływ na wyniki, znaleźlibyśmy dużą różnicę między Pearsonem a Spearmanem i dlatego powinniśmy używać Spearmana jako miary zależności.