Percentyl - Co to jest, definicja i pojęcie

Spisie treści:

Anonim

Percentyl jest statystyczną miarą pozycji, dzielącą uporządkowany rozkład danych na sto równych części.

Ta niecentralna miara pozycji dostarcza informacji o odsetku obserwacji zmiennej w kolejności od najniższej do najwyższej, które są poniżej jej wartości.

W ten sposób 20. percentyl (P20) byłby wartością zmiennej, znajdującą się na granicy pierwszych 20.

Jak obliczany jest percentyl?

Podobnie jak wszystkie kwantyle, percentyl można obliczyć dla danych zgrupowanych lub nie. W przypadku tych pierwszych istnieją dość skomplikowane formuły, które możemy znaleźć w podręcznikach statystycznych. W przypadku tych ostatnich najłatwiej jest użyć arkusza kalkulacyjnego.

Na obrazie widzimy formę przedstawienia. Główny prostokąt reprezentuje dane uporządkowane od najniższego do najwyższego, a jasnoniebieskie reprezentują różne percentyle.

Pokazaliśmy trzy najważniejsze. Zwłaszcza P50, który odpowiada medianie.

Dołączamy również wzór do obliczenia.

Charakterystyka percentylowa

Przyjrzyjmy się niektórym z najważniejszych cech percentyla.

  • Przede wszystkim jest podobny do innych pomiarów położenia niecentralnego. Dlatego informuje nas o pozycji danych w stosunku do innych.
  • Z drugiej strony w wielu sytuacjach dostarcza bardziej szczegółowych informacji niż inne. Na przykład niektóre wskaźniki wpływu czasopism naukowych używają tego zamiast kwartyla.
  • Ponadto jest bardzo przydatny do grupowania dużej ilości danych. Kiedy pracujemy z wieloma przypadkami, inne kwantyle mogą dawać grupy, które są zbyt duże i trudne do interpretacji.
  • Ma jednak wady związane z powyższym. Nie jest to przydatne w przypadku próbek z niewielką liczbą przypadków, ponieważ grupy byłyby zbyt małe. Dlatego w takich okolicznościach zalecane są inne, takie jak kwartyl lub decyl.

Przykład percentyla i wskaźnika wpływu

Czasopisma naukowe mierzą swoje znaczenie za pomocą tzw. wskaźników wpływu. Jest to powszechnie stosowany wskaźnik w nauce.

Najbardziej znanym jest JCR, który dzieli publikacje na kwartyle. Jednak drugie znaczenie ma SJR, który robi to w percentylach.

Wyobraźmy sobie więc fikcyjny przykład, taki jak ten na obrazku.

Widzimy, że to, co nazwaliśmy magazynkiem 1, jest w P15, podczas gdy 2 jest w P55, a 3 w P95.

W tym przypadku największy wpływ ma numer trzy, ponieważ indeksy byłyby uporządkowane od najniższego do najwyższego.