Percentyl jest statystyczną miarą pozycji, dzielącą uporządkowany rozkład danych na sto równych części.
Ta niecentralna miara pozycji dostarcza informacji o odsetku obserwacji zmiennej w kolejności od najniższej do najwyższej, które są poniżej jej wartości.
W ten sposób 20. percentyl (P20) byłby wartością zmiennej, znajdującą się na granicy pierwszych 20.
Jak obliczany jest percentyl?
Podobnie jak wszystkie kwantyle, percentyl można obliczyć dla danych zgrupowanych lub nie. W przypadku tych pierwszych istnieją dość skomplikowane formuły, które możemy znaleźć w podręcznikach statystycznych. W przypadku tych ostatnich najłatwiej jest użyć arkusza kalkulacyjnego.
Na obrazie widzimy formę przedstawienia. Główny prostokąt reprezentuje dane uporządkowane od najniższego do najwyższego, a jasnoniebieskie reprezentują różne percentyle.
Pokazaliśmy trzy najważniejsze. Zwłaszcza P50, który odpowiada medianie.
Dołączamy również wzór do obliczenia.
Charakterystyka percentylowa
Przyjrzyjmy się niektórym z najważniejszych cech percentyla.
- Przede wszystkim jest podobny do innych pomiarów położenia niecentralnego. Dlatego informuje nas o pozycji danych w stosunku do innych.
- Z drugiej strony w wielu sytuacjach dostarcza bardziej szczegółowych informacji niż inne. Na przykład niektóre wskaźniki wpływu czasopism naukowych używają tego zamiast kwartyla.
- Ponadto jest bardzo przydatny do grupowania dużej ilości danych. Kiedy pracujemy z wieloma przypadkami, inne kwantyle mogą dawać grupy, które są zbyt duże i trudne do interpretacji.
- Ma jednak wady związane z powyższym. Nie jest to przydatne w przypadku próbek z niewielką liczbą przypadków, ponieważ grupy byłyby zbyt małe. Dlatego w takich okolicznościach zalecane są inne, takie jak kwartyl lub decyl.
Przykład percentyla i wskaźnika wpływu
Czasopisma naukowe mierzą swoje znaczenie za pomocą tzw. wskaźników wpływu. Jest to powszechnie stosowany wskaźnik w nauce.
Najbardziej znanym jest JCR, który dzieli publikacje na kwartyle. Jednak drugie znaczenie ma SJR, który robi to w percentylach.
Wyobraźmy sobie więc fikcyjny przykład, taki jak ten na obrazku.
Widzimy, że to, co nazwaliśmy magazynkiem 1, jest w P15, podczas gdy 2 jest w P55, a 3 w P95.
W tym przypadku największy wpływ ma numer trzy, ponieważ indeksy byłyby uporządkowane od najniższego do najwyższego.