Statystyka to dyscyplina naukowa zajmująca się pozyskiwaniem, porządkowaniem i analizowaniem zbioru danych w celu uzyskania wyjaśnień i przewidywań dotyczących obserwowanych zjawisk.
Statystyka to metody, procedury i formuły, które pozwalają zbierać informacje, a następnie je analizować i wyciągać z nich odpowiednie wnioski. Można powiedzieć, że jest to Data Science, a jej głównym celem jest poprawa zrozumienia faktów z dostępnych informacji.
Pochodzenie słowa statystyka przypisuje się zwykle ekonomiście Gottfriedowi Achenwallowi (pruski, 1719-1772), który rozumiał statystykę jako „naukę o rzeczach należących do państwa”.
Należy zauważyć, że statystyka NIE jest gałęzią matematyki. Wykorzystuje narzędzia matematyczne w taki sam sposób, jak fizyka, inżynieria czy ekonomia, ale to nie czyni ich częścią matematyki. To prawda, że są ze sobą blisko spokrewnione, ale statystyka i matematyka to różne dyscypliny.
Główny nurt statystyczny
Jedną z podstawowych cech statystyki jest jej przekrojowość. Jej metodologia ma zastosowanie do badania różnych dyscyplin, takich jak: biologia, fizyka, ekonomia, socjologia itp.
Statystyka pozwala na uzyskanie odpowiednich wniosków do badania wszelkiego rodzaju czynników, takich jak: ludzie, zwierzęta, rośliny itp. Zwykle robi to za pomocą próbek statystycznych.
Typy statystyczne
Rodzaje statystyk można podzielić na dwie duże gałęzie: opisową i inferencyjną.
- Opisowe statystyki: Odnosi się do metod gromadzenia, organizowania, podsumowywania i prezentowania zestawu danych. Chodzi głównie o opisanie podstawowych cech danych i do nich zwykle stosuje się wskaźniki, wykresy i tabele.
- Statystyka wnioskowa: To jest krok poza zwykłym opisem. Odnosi się do metod wykorzystywanych do dokonywania prognoz, uogólnień i wyciągania wniosków z analizowanych danych z uwzględnieniem stopnia istniejącej niepewności.
Statystyki inferencyjne dzielą się na dwa duże typy: statystyki parametryczne i nieparametryczne.
- Statystyki parametryczne: Charakteryzuje się, ponieważ zakłada, że dane mają określony rozkład lub określone są pewne parametry, które powinny być spełnione. Tak więc na przykład w analizie parametrycznej możemy pracować przy założeniu, że populacja jest rozłożona jako normalna (musimy uzasadnić nasze założenie), a następnie wyciągać wnioski przy założeniu, że ten warunek jest spełniony.
- Statystyki nieparametryczne: W tym przypadku nie można założyć żadnego rodzaju rozkładu bazowego danych lub określonego parametru. Przykładem tego typu analizy jest test dwumianowy.
Geneza i historia statystyk
Historia statystyk sięga okresu sprzed 3000 lat p.n.e. Narodził się w celu zbierania potrzebnych państwu informacji, na przykład o rolnictwie i handlu.
W starożytnej Asyrii i Egipcie istnieją dowody na gromadzenie danych statystycznych. Podobnie w Rzymie zbierano dane demograficzne mieszkańców imperium, takie jak narodziny i śmiertelność. Ma to na celu podejmowanie lepszych decyzji rządu.
Później, w średniowieczu, statystyki nie poczyniły wielkich postępów. Jednak w epoce nowożytnej zostanie opracowany pierwszy nowożytny spis statystyczny i pierwsza tabela prawdopodobieństw wieków, oba wydarzenia z XVII wieku. Następnie, w XX wieku, narzędzia matematyczne z teorii prawdopodobieństwa zaczęto włączać do statystyki. Wynika to głównie z wkładu Kołmogorowa i Borela.
Aby dowiedzieć się więcej o historii statystyk, zapraszamy do lektury:
Pochodzenie statystykHistoria statystykCele statystyczne
Główne cele statystyk to:
- Poznaj cechy i wyciągaj wnioski lub wyciągaj wnioski dotyczące populacji docelowej. To zwykle z analizy próbki. Jest to typowe dla statystyki wnioskowania.
- Może pozwolić na ustalenie relacji między różnymi zmiennymi, znalezienie możliwego pochodzenia zjawiska, zbadanie zmian w tym wydarzeniu i, jeśli to możliwe, dokonanie projekcji na jego temat.
- Na podstawie uzyskanych wniosków można podejmować decyzje, na przykład, jeśli mówimy o badaniu statystycznym prowadzonym przez rząd w celu określenia polityki publicznej.
- W przypadku statystyki opisowej pozwala na posiadanie aktualnego stanu wiedzy, czyli poznanie cech bazy danych, na przykład poprzez obliczenie miar tendencji centralnej, takich jak średnia lub tryb.
- Wspiera inne dyscypliny, takie jak ekonomia, w analizie i projekcji wskaźników takich jak inflacja czy Produkt Krajowy Brutto. Podobnie w dziedzinie biologii mamy biostatystykę, która analizuje dane dotyczące zdrowia publicznego i środowiska.
Elementy statystyczne
Główne elementy statystyki to:
- Populacja: Grupa osób, które prezentują lub mogą prezentować wspólną cechę charakterystyczną, którą chcemy zbadać.
- Pokazać: Jest to podgrupa danych wyodrębnionych z populacji, która musi odpowiednio reprezentować całą grupę.
- Parametry: Są to miary, które oferują informacje o środku zbioru danych (miary tendencji centralnej), inne o rozproszeniu lub zmienności (miary rozproszenia), a inne o pozycji wartości (miary pozycji, takie jak percentyle).
- Eksperyment: Proces lub czynność prowadzona celowo w celu uzyskania serii danych lub potwierdzenia lub obalenia hipotezy.
- Zmienna: Charakterystyka lub jakość próbki lub populacji, do której można przypisać wartość.
Przykład wykorzystania statystyki w ekonomii
Statystyki są szeroko stosowane w analizie ekonomicznej. Pomaga nam sprawdzić zastosowanie teorii ekonomii w praktyce. Oto kilka przykładów wykorzystania statystyki w ekonomii:
- Przygotowanie zagregowanych wskaźników makroekonomicznych.
- Prognozy dotyczące przyszłego zachowania popytu.
- Sprawdź słuszność hipotez opartych na teorii ekonomii.
- Oblicz stopę bezrobocia.
- Organizuj i prezentuj dane ekonomiczne, takie jak: ewolucja cen, PKB itp.
Zaleca się przeczytanie:
- Zmienna losowa
- Prosta próbka losowa