Kwantyl - co to jest, definicja i pojęcie

Kwantyl to punkt, który dzieli dystrybuantę zmiennej losowej na regularne przedziały.

Dlatego nie jest niczym innym jak techniką statystyczną oddzielania danych od rozkładu. Oczywiście musi być spełnione, że grupy są równe. Z tego powodu istnieją różne typy kwantylów, jak zobaczymy później, w zależności od liczby utworzonych przez nie partycji.

Są niezwykle przydatne w wielu praktycznych zastosowaniach, na przykładzie pokażemy jedno.

Formularz obliczeń kwantylowych

Kwantyle można obliczyć z parametrycznego i nieparametrycznego punktu widzenia. Przyjrzyjmy się zarówno bardziej szczegółowo, jak i tak zwanej „funkcji kwantylowej”.

  • Parametryczny: Są używane w dystrybucjach, których kształt znamy. Oznacza to, że rozkład będzie normalny, równomierny, wykładniczy i tak dalej. W ten sposób zakłada się, że jest ona znana i jej główne parametry (średnia arytmetyczna i wariancja).
  • Nieparametryczna: Nadaje się do małych próbek, gdzie trudno jest poznać jego dokładny kształt i dlatego nie znamy jego funkcji dystrybucji. Ta metoda zapewnia podobne wartości do poprzedniej, gdy próbka wzrasta, a zatem użycie obu jest obojętne.
  • Funkcja kwantylowa: Mamy do czynienia z probabilistyczną formą kalkulacji. Celem jest obliczenie wartości, która ma określone prawdopodobieństwo w funkcji rozkładu. Nie będziemy wchodzić w pytania matematyczne, które komplikują koncepcję.

Najczęstsze kwantyle

Pokażemy, które kwantyle są najczęściej używane w statystykach. Większość z nich jest powszechnie wykorzystywana do szczegółowej analizy rozkładu danych. Ponadto innym jego zastosowaniem jest dzielenie danych na grupy, z możliwością wyboru najwyższego lub najniższego. W przykładzie zobaczymy to bardziej szczegółowo.

  • Kwartyl: Podziel wartości na cztery równe grupy i są trzy kwartyle. To jest najczęstsze. Kwartyl pierwszy (Q1) to najniższy wynik, a kwartyl trzeci (Q3) to najwyższy. Z drugiej strony, kwartyl drugi (Q2) odpowiada medianie (Me), która jest statystyką pozycji, która dzieli rozkład danych na pół. Wartości kwantylowe wyniosłyby 0,25 (Q1), 0,5 (Q2) i 0,75 (Q3).
  • Kwintyl: Podobnie jak poprzednia, jest rzadsza i dzieli dane na pięć równych części. Dlatego istnieją cztery kwintyle. Wartości kwantylowe w tym przypadku wyniosłyby 0,20, 0,40, 0,60, 0,80.
  • Decyl: W tym przypadku są podzielone na dziesięć części, a zatem jest dziewięć decyli. Znowu nie jest to zbyt częste. Ich wartości wyniosłyby 0,1 do 0,9.
  • Centyle: Mamy do czynienia z wariantem, w którym dystrybucja jest podzielona na sto równych części. Może to być interesujące w przypadku bardzo dużych próbek. Ich wartości wahają się od 0,01 do 0,99.

Przykład kwantylowy

Spójrzmy na przykład, w którym mamy szereg danych o dochodach mieszkańców pewnej gminy. Obliczyliśmy trzy najbardziej reprezentatywne kwartyle i trzy decyle. Uwzględniamy zastosowane formuły, biorąc pod uwagę, że dla decyli posługujemy się odpowiednikiem w percentylach. Pamiętaj, że dane w Q2 i D5 są równoważne medianie.

Możemy zauważyć, że dochód osób reprezentujących najmniej uprzywilejowane 25% (Q1) wynosi 2900. W stosunku do decyla, dochód 10% (D1) osób otrzymujących najmniej wynosi 2800. Ta sama interpretacja jest dokonywana z przełożonymi, ale w odwrotnej kolejności. 25% (Q3), którzy zarabiają najwięcej, uzyskuje dochód w wysokości 4100, a 10% z 4800. Kwantyl odzwierciedla zatem istotne informacje, aby dowiedzieć się więcej o zmiennej.

Będziesz pomóc w rozwoju serwisu, dzieląc stronę ze swoimi znajomymi

wave wave wave wave wave