Percentyl - Co to jest, definicja i pojęcie

Percentyl jest statystyczną miarą pozycji, dzielącą uporządkowany rozkład danych na sto równych części.

Ta niecentralna miara pozycji dostarcza informacji o odsetku obserwacji zmiennej w kolejności od najniższej do najwyższej, które są poniżej jej wartości.

W ten sposób 20. percentyl (P20) byłby wartością zmiennej, znajdującą się na granicy pierwszych 20.

Jak obliczany jest percentyl?

Podobnie jak wszystkie kwantyle, percentyl można obliczyć dla danych zgrupowanych lub nie. W przypadku tych pierwszych istnieją dość skomplikowane formuły, które możemy znaleźć w podręcznikach statystycznych. W przypadku tych ostatnich najłatwiej jest użyć arkusza kalkulacyjnego.

Na obrazie widzimy formę przedstawienia. Główny prostokąt reprezentuje dane uporządkowane od najniższego do najwyższego, a jasnoniebieskie reprezentują różne percentyle.

Pokazaliśmy trzy najważniejsze. Zwłaszcza P50, który odpowiada medianie.

Dołączamy również wzór do obliczenia.

Charakterystyka percentylowa

Przyjrzyjmy się niektórym z najważniejszych cech percentyla.

  • Przede wszystkim jest podobny do innych pomiarów położenia niecentralnego. Dlatego informuje nas o pozycji danych w stosunku do innych.
  • Z drugiej strony w wielu sytuacjach dostarcza bardziej szczegółowych informacji niż inne. Na przykład niektóre wskaźniki wpływu czasopism naukowych używają tego zamiast kwartyla.
  • Ponadto jest bardzo przydatny do grupowania dużej ilości danych. Kiedy pracujemy z wieloma przypadkami, inne kwantyle mogą dawać grupy, które są zbyt duże i trudne do interpretacji.
  • Ma jednak wady związane z powyższym. Nie jest to przydatne w przypadku próbek z niewielką liczbą przypadków, ponieważ grupy byłyby zbyt małe. Dlatego w takich okolicznościach zalecane są inne, takie jak kwartyl lub decyl.

Przykład percentyla i wskaźnika wpływu

Czasopisma naukowe mierzą swoje znaczenie za pomocą tzw. wskaźników wpływu. Jest to powszechnie stosowany wskaźnik w nauce.

Najbardziej znanym jest JCR, który dzieli publikacje na kwartyle. Jednak drugie znaczenie ma SJR, który robi to w percentylach.

Wyobraźmy sobie więc fikcyjny przykład, taki jak ten na obrazku.

Widzimy, że to, co nazwaliśmy magazynkiem 1, jest w P15, podczas gdy 2 jest w P55, a 3 w P95.

W tym przypadku największy wpływ ma numer trzy, ponieważ indeksy byłyby uporządkowane od najniższego do najwyższego.

Popularne Wiadomości

Cyfrowa transformacja BBVA przechodzi przez BIG DATA

Dla Francisco Gonzáleza, prezesa BBVA, sektor finansowy jest świadkiem odejścia od big data, Internetu rzeczy i sztucznej inteligencji. Zawody, w których nie widać linii mety. Przyjęta przez BBVA strategia technologiczna zapewnia nie tylko większą rentowność dzięki niższym kosztom Czytaj więcej…

Najważniejsze marki na świecie

Tutaj prezentujemy światowy ranking marek 2015 złożony ze 100 najbardziej prestiżowych marek z całego świata, kraju pochodzenia…