Curtosis - Co to jest, definicja i pojęcie

Spisie treści:

Anonim

Kurtoza jest miarą statystyczną określającą stopień koncentracji wartości zmiennej wokół centralnej strefy rozkładu częstotliwości. Jest również znany jako miara kierowania.

Kiedy mierzymy zmienną losową, ogólnie rzecz biorąc, wyniki o największej częstości to wyniki wokół średniej rozkładu. Wyobraźmy sobie wzrost uczniów w klasie. Jeśli średni wzrost klasy wynosi 1,72 cm, najnormalniejszą rzeczą jest to, że wzrost pozostałych uczniów jest zbliżony do tej wartości (z pewnym stopniem zmienności, ale nie za duży). Jeśli tak się stanie, rozkład zmiennej losowej jest uważany za rozkład normalny. Ale biorąc pod uwagę nieskończoność zmiennych, które można zmierzyć, nie zawsze tak jest.

Są zmienne, które prezentują wyższy stopień koncentracji (mniejsze rozproszenie) wartości wokół ich średniej, a inne wręcz przeciwnie, wykazują niższy stopień koncentracji (większe rozproszenie) swoich wartości wokół ich wartości centralnej. Dlatego kurtoza informuje nas o tym, jak ostry (większe stężenie) lub spłaszczony (niższe stężenie) jest rozkład.

Miary tendencji centralnejCzęstotliwość skumulowana

Rodzaje kurtozy

W zależności od stopnia kurtozy mamy trzy rodzaje rozkładów:

1. Leptokurtyka: Istnieje duża koncentracja wartości wokół ich średniej (g2>3)

2. Mezokurtyk: Istnieje normalne stężenie wartości wokół ich średniej (g2=3).

3. Platicúrtica: Występuje niska koncentracja wartości wokół ich średniej (g2<3).

Pomiary kurtozy zgodnie z danymi

W zależności od grupowania danych lub nie, używana jest ta lub inna formuła.

Dane niezgrupowane:

Dane zgrupowane w tabelach częstości:

Dane pogrupowane w przedziały:

Przykład obliczania kurtozy dla danych niezgrupowanych

Załóżmy, że chcemy obliczyć kurtozę następującego rozkładu:

8,5,9,10,12,7,2,6,8,9,10,7,7.

Najpierw obliczamy średnią arytmetyczną (µ), która wyniesie 7,69.

Następnie obliczamy odchylenie standardowe, które wyniesie 2,43.

Po uzyskaniu tych danych i dla wygody w obliczeniach można sporządzić tabelę do obliczenia części licznika (czwarty moment rozkładu). Dla pierwszego obliczenia byłoby to: (Xi-µ) 4 = (8-7,69) 4 = 0,009.

Dane(Xi-µ) 4
80,0090
552,5411
92,9243
1028,3604
12344,3330
70,2297
21049,9134
68,2020
80,0090
92,9243
1028,3604
70,2297
70,2297
N = 13∑ = 1.518,27

Po wykonaniu tej tabeli musielibyśmy po prostu zastosować formułę wcześniej eksponowaną, aby uzyskać kurtozę.

sol2 = 1.518,27/13*(2,43)^4 = 3,34

W tym przypadku od g2 jest większy niż 3, rozkład byłby leptokurtyczny, prezentując większą punktację niż rozkład normalny.

Nadmierna kurtoza

W niektórych podręcznikach kurtoza jest przedstawiana jako kurtoza nadmierna. W tym przypadku jest on bezpośrednio porównywany z rozkładem normalnym. Ponieważ rozkład normalny ma kurtozę 3, aby uzyskać nadmiar, musielibyśmy odjąć tylko 3 od naszego wyniku.

Nadmiar kurtozy = g2-3 = 3,34-3 = 0,34.

Interpretacja wyniku w tym przypadku byłaby następująca:

sol2-3> 0 -> rozkład leptokurtyczny.

sol2-3 = 0 -> rozkład mezokortyczny (lub normalny).

sol2-3 rozkład platicúrtic.

Opisowe statystyki