Rozproszenie statystyczne - co to jest, definicja i pojęcie

Rozrzut statystyczny to stopień, w jakim rozkład danych oddala się lub zbliża w wartości bezwzględnej do średniej arytmetycznej, jako statystyki pozycji centralnej.

Dlatego miary dyspersji będą zawsze towarzyszyć tej średniej lub średniej.

W ten sposób zgłaszaliby zmienność lub rozproszenie danych w stosunku do nich. Im wyższe wartości, jak zobaczymy poniżej, tym większa dyspersja statystyczna.

Znaczenie rozproszenia statystycznego

Kiedy chcemy przeprowadzić analizę opisową, najpierw obliczamy sumaryczne miary pozycji. Najczęstsze to średnia, mediana, moda lub kwartyle, decyle, kwintyle lub percentyle. Ponadto musimy znać rozpiętość statystyczną.

Miary dyspersji dostarczają bardzo istotnych informacji. Jeśli rozrzut jest bardzo wysoki, wpływa na średnią i nie jest już reprezentatywny dla grupy jako miara sumaryczna. Dlatego zwykle oba dane idą w parze.

Statystyczne miary dyspersji

Istnieją różne miary dyspersji, które pozwalają na jego pomiar. Zobaczmy podsumowanie najważniejszych. Przeanalizowaliśmy je bardziej szczegółowo tutaj.

Ranga: Nie więcej niż różnica między najmniejszą i największą wartością rozkładu.
Odchylenie średnie: Byłby to odpowiednik średniej różnych odchyleń poszczególnych danych od średniej.
Wariancja i odchylenie standardowe: Są to najbardziej znane miary dyspersji. Zwykle stosuje się drugi, łatwiejszy do obliczenia (pierwiastek wariancji) i interpretacji. Wyrażane są w wartościach bezwzględnych.
Współczynnik zmienności: W tym przypadku jest obliczany z odchyleniem standardowym i średnią i służy do porównania, ponieważ jest wyrażony w wartościach względnych (%).

Statystyczne miary dyspersji

Przykład rozproszenia statystycznego

Na koniec zobaczymy przykład dziesięciu fikcyjnych krajów i ich PKB.

Widzimy, że bardzo się różnią, jeśli chodzi o ich PKB. Od największego, z 7000 milionami jednostek, do najmniejszego, z 2500 milionami.

Widzimy, że średnia wynosi prawie 4500 milionów, ale miary dyspersji są bardzo wysokie. Z jednej strony średnie odchylenie, prawie 1500 milionów jednostek. Wariancja, która niewiele wnosi, ale pozwala na obliczenie odchylenia standardowego prawie 1500 milionów jednostek. Wreszcie współczynnik zmienności prawie 33%.

Można powiedzieć, że dyspersja statystyczna jest bardzo duża, a średnia nie jest reprezentatywna. Coś, co można zweryfikować, ponieważ niewiele jest danych i obserwuje się kraje o wysokim PKB, a inne o niskim. Ale wyobraź sobie 194 uznane przez ONZ, tam są całkiem przydatne, prawda?