Proces statystyczny to zestaw etapów lub faz, które muszą zostać zakończone, aby przeprowadzić badanie oparte na informacjach ilościowych i uzyskać wyniki wierne badanej rzeczywistości.
Kiedy mówimy o procesie statystycznym, mówimy o szeregu kroków, które należy wykonać, aby uzyskać wyniki wierne rzeczywistości, którą badamy w zamierzonym badaniu statystycznym. Jest to konieczne, ponieważ jeśli nie wykonamy tych kroków, możemy wyciągnąć błędne wnioski, a tym samym podjąć złe decyzje.
Na przykład wyobraźmy sobie, że mamy lodziarnię. Musimy w przybliżeniu wiedzieć, ile lodów powinniśmy kupić w oparciu o zapotrzebowanie, jakie będziemy mieli. Jeśli więc nam się nie uda, klienci mogliby dotrzeć do kogo musielibyśmy im powiedzieć, że w tej lodziarni nie ma lodów. Wręcz przeciwnie, jeśli mamy za dużo, można to zepsuć. Dlatego należy spróbować oszacować, ile powinniśmy kupić, a przynajmniej przybliżony zakres. Jeśli do obliczenia tego zakresu zbierzemy dane, które nie są reprezentatywne (na przykład lodziarnia zlokalizowana w innym mniej zamożnym mieście), możemy się mylić.
Tak więc, mając to jasne, musimy znać szereg kroków i szczegółów, którymi musimy się kierować, aby wyniki były dostosowane do rzeczywistości i podejmować lepsze decyzje.
Etapy procesu statystycznego
W zależności od odwiedzanego podręcznika lub autora mogliśmy zobaczyć różne etapy o różnych nazwach. W zasadzie prawie wszystkie dokumenty na ten temat zawierają te same sekcje, tyle że niektóre zawierają kilka faz w jednym, a inne bardziej fragmentują proces.
W naszym przypadku uważamy, że proces statystyczny składa się z:
Stwierdzenie problemu
W opisie problemu znajduje się oś centralna, na której można wyartykułować wszystko inne. Ta faza odpowiada na następujące pytanie: Czego muszę się uczyć i dlaczego? Czasami, choć może się to wydawać niewiarygodne, może prowadzić nas do wniosku, że tak naprawdę nie musimy przeprowadzać badań statystycznych.
Zbieranie danych
Po zgłoszeniu problemu musimy zebrać dane. Tutaj ważna jest metodologia. Więc są różne względy. W związku z tym musimy ustalić rodzaj próby, wielkość próby, rodzaj zbierania danych (na przykład poprzez bazy danych lub ankiety spersonalizowane), osobiście, online lub telefonicznie itp.
Organizacja danych
Gdy mamy już wszystkie dane, pozostaje je ujednolicić i uporządkować. Jak we wszystkim musimy wprowadzić dane w programie lub platformie, która następnie pozwoli nam obliczyć określone metryki i poprawnie przeanalizować. Aby to zrobić, zawsze wygodnie jest uporządkować dane. Co więcej, czasami będziemy musieli zbierać dane z różnych baz danych, które oferują różne formaty plików i konieczne będzie ujednolicenie wszystkiego w tym samym formacie.
Analiza danych
Gdy problem zostanie postawiony, zebrane i uporządkowane dane, możemy skutecznie go przeanalizować. W zależności od opisu problemu zostanie przeprowadzony taki lub inny rodzaj analizy. Na przykład, jeśli chcemy wiedzieć, czy dwie zmienne są zależne, możemy użyć analizy kointegracji. Natomiast jeśli chcemy zbadać całkowite rozproszenie aktywów finansowych, obliczymy przedział statystyczny.
Interpretacja danych
Wreszcie mamy interpretację danych. Nie ma sensu prawidłowe przeprowadzanie wszystkich faz procesu statystycznego, jeśli ostatecznie interpretacja jest błędna. Dzieje się tak, ponieważ jeśli interpretacja jest błędna, decyzje przyniosą niepożądany skutek. Załóżmy na przykład, że przeprowadzamy badanie zmienności sprzedaży firmy. Jeśli po uzyskaniu wyników okaże się, że jest duże rozproszenie, należy je zmniejszyć, a interpretujemy, że tak nie jest, może to negatywnie wpłynąć na firmę.
Pięć kroków znajduje odzwierciedlenie na poniższym schemacie:
Opisowe statystyki