Odchylenie kwartylowe – co to jest, definicja i pojęcie

Odchylenie kwartylowe to statystyczna miara rozproszenia, która zwraca centralną wartość rozstępu międzykwartylowego i jest stosowana w skośnych zestawach danych.

Innymi słowy, odchylenie kwartylowe służy do obliczania mediany rozstępu międzykwartylowego (IQR) i jest używane w zestawach danych z kilkoma wartościami ekstremalnymi.

Skrótowym określeniem odchylenia kwartylowego jest DQ.

Zakres międzykwartylowy

Rozstęp międzykwartylowy jest miarą rozrzutu zbioru danych zwykle używanego na wykresie skrzynkowym. Innymi słowy, rozstęp międzykwartylowy jest różnicą między przedostatnim a pierwszym kwartylem rozkładu użytego na wykresie skrzynkowym.

IQR = Q3 - Q1

Zaletą korzystania z zakresu międzykwartylowego jest to, że można obliczyć odchylenie kwartylowe (DQ), co jest bardzo odpowiednią miarą dyspersji, gdy mamy tendencyjne zestawy danych.

Wzór na odchylenie kwartylowe

Odchylenie kwartylowe oblicza się jako dzielenie rozstępu międzykwartylowego przez 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Ponieważ uwzględniamy tylko rozrzut między trzecim a pierwszym kwartylem, ignorujemy wszystkie dane spoza tego zakresu. A zatem wszystkie wartości bliskie ekstremalności. Jeśli więc podzielimy rozstęp międzykwartylowy przez dwa, otrzymamy medianę rozproszenia.

Przykład odchylenia kwartylowego

Przypuszczamy, że chcemy obliczyć rozstęp międzykwartylowy i odchylenie kwartylowe liczby rowerzystów, którzy mijają nasz dom w ciągu roku.

  1. Najpierw liczymy rowerzystów i zbieramy informacje w tabeli.
  1. Po drugie, obliczamy pierwszy i trzeci kwartyl, aby uzyskać rozstęp międzykwartylowy.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Po trzecie, rozrzut kwartylowy obliczamy, dzieląc rozstęp międzykwartylowy przez dwa.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Rozpiętość kwartylowa dla tego zbioru danych wynosi 175. Liczba ta jest centralną wartością rozstępu międzykwartylowego.

Warto zauważyć, że dane za lipiec to ekstremalne dane, ponieważ są kilkakrotnie wyższe niż wszystkie inne dane. Można więc powiedzieć, że ten zestaw danych jest nastawiony na ten miesiąc. Dzięki „ignoracji” dyspersji kwartyla w kierunku skrajnych danych, wynik tego pomiaru jest bardzo podobny do tego, gdyby w lipcu krążyło tylko 600 rowerzystów. Gdyby w lipcu było tylko 600 rowerzystów, rozrzut kwartylowy wyniósłby 162,5, czyli bardzo blisko 175, biorąc pod uwagę, że liczba rowerzystów w tym miesiącu jest 10 razy mniejsza.

Będziesz pomóc w rozwoju serwisu, dzieląc stronę ze swoimi znajomymi

wave wave wave wave wave