Miary tendencji centralnej to parametry statystyczne, które informują o środku rozkładu próby lub populacji statystycznej.
Czasami mamy do czynienia z dużą ilością informacji. Zmienne, które prezentują dużo danych i są bardzo zróżnicowane. Dane z wieloma miejscami po przecinku, o różnym znaku lub długości. W takich przypadkach zawsze lepiej jest obliczyć miary, które dostarczają nam podsumowania informacji o wspomnianej zmiennej. Na przykład pomiary, które mówią nam, jaka wartość jest najczęściej powtarzana.
Niezależnie od powyższego nie musisz jechać tak daleko. Jeśli spojrzymy na poniższą tabelę, która pokazuje wynagrodzenie każdego z pracowników firmy produkującej kartony, otrzymamy:
Pracownik | Wynagrodzenie |
1 | € 1.235 |
2 | € 1.002 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.248 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.125 |
10 | € 768 |
Ktoś może się zastanawiać, ile zarabia przeciętny pracownik tej firmy? W takim przypadku mogą nam pomóc miary tendencji centralnej. W szczególności średnia. Jednak a priori wiemy tylko, że liczba będzie znajdować się między minimum a maksimum.
Miary tendencji centralnej
Wśród miar tendencji centralnej możemy znaleźć:
Pół
Średnia to średnia wartość zbioru danych liczbowych, obliczona jako suma zbioru wartości podzielona przez całkowitą liczbę wartości. Poniżej wzór na średnią arytmetyczną:
Zapoznaj się z wyjaśnieniem i przykładem średniejJak wyjaśniono w artykule, do którego link znajduje się powyżej, istnieje wiele rodzajów mediów. Wybór każdego rodzaju średniej ma związek, głównie z rodzajem danych, na podstawie których jest obliczana.
Mediana
Mediana to statystyka pozycji centralnej, która dzieli rozkład na dwie części, co oznacza, że po jednej stronie pozostaje taka sama liczba wartości, jak po drugiej. Zaproponowane formuły nie podadzą nam wartości mediany, dadzą nam natomiast pozycję, w której znajduje się w zbiorze danych. Formuły wskazujące pozycję mediany w szeregu są następujące:
- Gdy liczba obserwacji jest parzysta:
Mediana = (n + 1) / 2 → Średnia obserwowanych pozycji
- Gdy liczba obserwacji jest nieparzysta:
Mediana = (n + 1) / 2 → Wartość obserwacji
Zapoznaj się z wyjaśnieniem i przykładem medianymoda
Tryb to wartość, która występuje najczęściej w statystycznej próbce lub populacji. Sam w sobie nie ma formuły. To, co należy zrobić, to suma powtórzeń każdej wartości. Na przykład, jaki jest tryb poniższej tabeli płac?
Pracownik | Wynagrodzenie |
1 | € 1.236 |
2 | € 1.236 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.536 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.236 |
10 | € 768 |
Tryb wyniósłby 1236 euro. Jeśli spojrzymy na płace 10 pracowników, zobaczymy, że 1236 € powtarza się trzy razy.
Krytyka miar tendencji centralnej
Miary pozycji centralnej są pomocne w formie skróconej, ale nie kategorycznej. W podsumowaniu mogą dać nam informację, czego średnio można by się spodziewać. Ale nie zawsze są dokładne.
Aby lepiej przeanalizować te miary, wskazane jest połączenie miar tendencji centralnej z miarami dyspersji. Miary dyspersji też nie są niezawodne, ale dostarczają nam informacji o zmienności pewnej zmiennej. Załóżmy zatem, wzorując się na płacach, że istnieją dwie firmy A i B. W firmie A średnia pensja wynosi 3100 USD, podczas gdy firma B również 3100 USD. Może to doprowadzić nas do popełnienia błędu, że zarobki są takie same lub bardzo podobne. Ale niekoniecznie tak jest.
Może się zdarzyć, że firma A ma odchylenie standardowe 400 USD, podczas gdy firma B ma odchylenie standardowe 1000 USD. Wskazuje to, że z jakiegokolwiek powodu występuje większa nierówność w wynagrodzeniach firmy B niż w firmie A.