Miary tendencji centralnej

Miary tendencji centralnej to parametry statystyczne, które informują o środku rozkładu próby lub populacji statystycznej.

Czasami mamy do czynienia z dużą ilością informacji. Zmienne, które prezentują dużo danych i są bardzo zróżnicowane. Dane z wieloma miejscami po przecinku, o różnym znaku lub długości. W takich przypadkach zawsze lepiej jest obliczyć miary, które dostarczają nam podsumowania informacji o wspomnianej zmiennej. Na przykład pomiary, które mówią nam, jaka wartość jest najczęściej powtarzana.

Niezależnie od powyższego nie musisz jechać tak daleko. Jeśli spojrzymy na poniższą tabelę, która pokazuje wynagrodzenie każdego z pracowników firmy produkującej kartony, otrzymamy:

PracownikWynagrodzenie
1 € 1.235
2 € 1.002
3 € 859
4 € 486
5 € 1.536
6 € 1.248
7 € 1.621
8 € 978
9 € 1.125
10 € 768

Ktoś może się zastanawiać, ile zarabia przeciętny pracownik tej firmy? W takim przypadku mogą nam pomóc miary tendencji centralnej. W szczególności średnia. Jednak a priori wiemy tylko, że liczba będzie znajdować się między minimum a maksimum.

Miary tendencji centralnej

Wśród miar tendencji centralnej możemy znaleźć:

Pół

Średnia to średnia wartość zbioru danych liczbowych, obliczona jako suma zbioru wartości podzielona przez całkowitą liczbę wartości. Poniżej wzór na średnią arytmetyczną:

Zapoznaj się z wyjaśnieniem i przykładem średniej

Jak wyjaśniono w artykule, do którego link znajduje się powyżej, istnieje wiele rodzajów mediów. Wybór każdego rodzaju średniej ma związek, głównie z rodzajem danych, na podstawie których jest obliczana.

Mediana

Mediana to statystyka pozycji centralnej, która dzieli rozkład na dwie części, co oznacza, że ​​po jednej stronie pozostaje taka sama liczba wartości, jak po drugiej. Zaproponowane formuły nie podadzą nam wartości mediany, dadzą nam natomiast pozycję, w której znajduje się w zbiorze danych. Formuły wskazujące pozycję mediany w szeregu są następujące:

  • Gdy liczba obserwacji jest parzysta:

Mediana = (n + 1) / 2 → Średnia obserwowanych pozycji

  • Gdy liczba obserwacji jest nieparzysta:

Mediana = (n + 1) / 2 → Wartość obserwacji

Zapoznaj się z wyjaśnieniem i przykładem mediany

moda

Tryb to wartość, która występuje najczęściej w statystycznej próbce lub populacji. Sam w sobie nie ma formuły. To, co należy zrobić, to suma powtórzeń każdej wartości. Na przykład, jaki jest tryb poniższej tabeli płac?

PracownikWynagrodzenie
1 € 1.236
2 € 1.236
3 € 859
4 € 486
5 € 1.536
6 € 1.536
7 € 1.621
8 € 978
9 € 1.236
10 € 768

Tryb wyniósłby 1236 euro. Jeśli spojrzymy na płace 10 pracowników, zobaczymy, że 1236 € powtarza się trzy razy.

Krytyka miar tendencji centralnej

Miary pozycji centralnej są pomocne w formie skróconej, ale nie kategorycznej. W podsumowaniu mogą dać nam informację, czego średnio można by się spodziewać. Ale nie zawsze są dokładne.

Aby lepiej przeanalizować te miary, wskazane jest połączenie miar tendencji centralnej z miarami dyspersji. Miary dyspersji też nie są niezawodne, ale dostarczają nam informacji o zmienności pewnej zmiennej. Załóżmy zatem, wzorując się na płacach, że istnieją dwie firmy A i B. W firmie A średnia pensja wynosi 3100 USD, podczas gdy firma B również 3100 USD. Może to doprowadzić nas do popełnienia błędu, że zarobki są takie same lub bardzo podobne. Ale niekoniecznie tak jest.

Może się zdarzyć, że firma A ma odchylenie standardowe 400 USD, podczas gdy firma B ma odchylenie standardowe 1000 USD. Wskazuje to, że z jakiegokolwiek powodu występuje większa nierówność w wynagrodzeniach firmy B niż w firmie A.