Statystyka opisowa to dyscyplina, która odpowiada za zbieranie, przechowywanie, porządkowanie, tworzenie tabel lub wykresów oraz obliczanie podstawowych parametrów na zbiorze danych.
Statystyka opisowa jest, obok wnioskowania statystycznego lub statystyki wnioskowania, jedną z dwóch wielkich gałęzi statystyki. Wskazuje na to własna nazwa, próbuje coś opisać. Ale nie opisuj tego w żaden sposób, tylko ilościowo. Weź pod uwagę wagę pudełka z warzywami, wzrost osoby lub kwotę, jaką zarabia firma. O tych zmiennych można by wiele powiedzieć. Na przykład możemy wskazać, że ta lub ta skrzynka pomidorów waży dużo lub mniej niż inne. Kontynuując inny przykład, moglibyśmy powiedzieć, że dochód firmy bardzo się zmienia w czasie lub że osoba ma średni wzrost.
Aby dyktować powyższe stwierdzenia o dużej, małej, wysokiej, niskiej, bardzo zmiennej lub małej zmiennej potrzebujemy zmiennych pomiarowych. Oznacza to, że musimy je określić ilościowo, podać liczbę. Mając to na uwadze, moglibyśmy użyć gramów lub kilogramów jako jednostki miary, aby obliczyć wagę tylu pudełek pomidorów, ile bierzemy pod uwagę. Gdy zważymy trzydzieści pudeł, będziemy wiedzieć, które z nich ważą więcej, które mniej, ile jest najczęściej powtarzanych lub czy istnieje duża rozbieżność między wagami różnych pudełek.
Statystyka opisowa narodziła się z tego pomysłu, aby zbierać dane, przechowywać je, tworzyć tabele, a nawet wykresy, które oferują nam informacje na określony temat. Dodatkowo oferują nam miary, które podsumowują informacje z dużej ilości danych.
Rodzaje zmiennych statystycznych
W ramach statystyki opisowej możemy opisać dane jakościowo lub ilościowo.
- Zmienna jakościowa: Odnosi się do jakości. Przykłady: kolor oczu lub włosów danej osoby.
- Zmienna ilościowa: Odnosi się do miary ilościowej. Przykłady: wzrost osoby w centymetrach lub waga osoby w kilogramach.
Zatem na tych zmiennych można obliczyć określone parametry. Zwłaszcza na zmiennych ilościowych. Bo np. jaka jest średnia wartość koloru oczu? Jeśli jest pięć osób o niebieskim kolorze oczu i pięciu o zielonym kolorze oczu, średnia nie będzie taka, że mają oni przeciętny niebiesko-zielony kolor oczu. Dlatego w takim przypadku nie byłoby możliwe obliczenie niektórych parametrów, które zobaczymy poniżej.
Zmienna statystycznaPodstawowe parametry statystyczne
W celu podsumowania informacji opracowano różne formuły, które oferowały środki określonego typu. Są więc takie, które podają nam informacje o centrum, inne o rozproszeniu lub zmienności, a jeszcze inne o położeniu wartości.
- Miary tendencji centralnej: Nazwane tak, ponieważ dostarczają informacji o centrum zestawu danych. Na przykład średnia jest miarą trendu lub centralnej pozycji, ponieważ średnia daje nam wyśrodkowaną wartość zbioru danych. Gdzie możemy powiedzieć, że znajduje się punkt środkowy? W centrum, mniej więcej w środku. Innym przykładem miary tendencji centralnej jest mediana.
- Miary dyspersji: Są one również znane jako miary zmienności. Na przykład odchylenie standardowe jest miarą zmienności, ponieważ mówi nam, czy wartości zbioru danych są bardzo różne, czy nie. Dwa kolejne przykłady miar dyspersji to wariancja i rozstęp statystyczny.
- Pomiary pozycji: Nie są najbardziej znane, ale są często używane. Przykładem tego są percentyle lub decyle. Gdy określone dane znajdują się w 90. percentylu, oznacza to, że 90% danych znajduje się poniżej tych danych. Istnieją inne miary pozycji, takie jak kwartyle lub niektóre warianty, takie jak pierwszy kwartyl.
Rozkład częstotliwości
Interesujące jest również obserwowanie rozkładu częstotliwości. W tym celu istnieją pewne pojęcia, które musimy znać:
- Częstotliwość bezwzględna: jest to całkowita liczba powtórzeń obserwacji. Czasami obserwacje mogą być przedstawiane w odstępach.
- Częstotliwość względna: Jest to procentowo liczba powtórzeń obserwacji lub ich zestawu.
- Akumulowana częstotliwość: może być akumulowana względna lub akumulowana bezwzględna. Wskazuje kwotę skumulowaną do określonej obserwacji.
Tabele i wykresy w statystyce opisowej
Chociaż tabele i wykresy nie są charakterystyczne dla statystyk opisowych, to jednak je charakteryzują. W raportach, opracowaniach i badaniach bardzo często stosuje się wykresy. Pomagają nam przedstawić informacje w prostszy i bardziej ograniczony sposób.
Oczywiście w tabelach i wykresach istnieje ogromna ilość typów. Oto kilka przykładów często używanych wykresów i tabel.
- Histogram.
- Grafika słupkowa.
- Wykres kołowy.
- Tabele prawdopodobieństwa.
- Stoły dwuwymiarowe.
- Wykres pudełkowy.
Przykłady statystyk opisowych
Przykładem statystyki opisowej byłoby obliczenie średniej liczby bramek na mecz piłkarza. Jest to statystyka opisowa, ponieważ staramy się opisać zmienną (liczbę bramek). W tym przypadku obliczając metrykę.
Tak więc stwierdzenie, że Ronaldo strzelił 1,05 gola na mecz w ciągu ostatnich 30 meczów, jest właściwą opisową frazą statystyczną.
Moglibyśmy również powiedzieć, na przykład, że 30% kolegów Juana z klasy ma niebieskie oczy, 60% brązowe, a pozostałe 10% czarne. Byłaby to zmienna jakościowa (kolor oczu), ale opisujemy częstotliwość, z jaką się pojawia.