Statystyka nieparametryczna to gałąź wnioskowania statystycznego, której obliczenia i procedury opierają się na nieznanych rozkładach.
Statystyki nieparametryczne nie są zbyt popularne. Istnieje jednak na ten temat bardzo obszerna literatura. Problemem, który ma rozwiązać statystyka nieparametryczna, jest brak znajomości rozkładu prawdopodobieństwa.
Innymi słowy, statystyki nieparametryczne próbują poznać naturę zmiennej losowej. Gdy już wiesz, jak się zachowuje, wykonaj obliczenia i metryki, które go charakteryzują.
Taki jest cel statystyki nieparametrycznej. Zobaczymy to bardziej szczegółowo poniżej.
Cel statystyki nieparametrycznej
Istnieją różne typy rozkładów prawdopodobieństwa, na których działają statystyki parametryczne. Teraz, kiedy nie wiemy, jakiemu rozkładowi prawdopodobieństwa odpowiada zmienna, jakich obliczeń używamy?
Oznacza to, że gdy nie znamy rozkładu prawdopodobieństwa zbioru danych, musimy wnioskować statystycznie za pomocą procedur nieparametrycznych.
Innymi słowy, jeśli nie wiemy, jaki rozkład prawdopodobieństwa ma dane zjawisko, nie możemy dokonywać oszacowań tak, jakbyśmy naprawdę wiedzieli, jak to się rozkłada. To jest cel statystyki parametrycznej, aby umożliwić nam poznanie rozkładu, abyśmy mogli przejść do następnego kroku (statystyki parametrycznej).
Testy nieparametryczne
Oczywiście, jeśli nie wiemy, jak rozkłada się zjawisko losowe, co powinniśmy zrobić? Bardzo łatwe. Naszą misją będzie próba poznania sposobu dystrybucji. Aby spróbować dowiedzieć się, jaki rodzaj dystrybucji ma dane zjawisko, mamy do dyspozycji serię testów, które mogą nam w tym pomóc. Do najpopularniejszych testów nieparametrycznych należą:
- Test dwumianowy
- Test Andersona-Kochania
- Test Cochrana
- Test kappa Cohena
- Test Fishera
- Test Friedmana
- Test Kendalla
- Test Kołmogórowa-Smirnowa
- Test Kuipera
- Test Manna-Whitneya lub test Wilcoxona
- Test McNemara
- Test mediany
- Test Siegela-Tukeya
- Test znaków
- Współczynnik korelacji Spearmana
- Tabele krzyżowe
- Test Walda-Wolfowitza
- Test rangowy podpisany przez Wilcoxona
Wszystkie te testy mają nam powiedzieć, czy zmienna losowa jest rozłożona w taki czy inny sposób. Na przykład możliwym wynikiem może być: zmienna losowa X jest rozłożona w tempie rozkładu normalnego.
Podsumowując, wyniki nie są nieomylne. Aby wykonać testy nieparametryczne, musimy dysponować próbami statystycznymi. Dlatego wyniki mogą być wiarygodne, ale nie muszą być w 100% idealne.