Analiza wariancji lub ANOVA (analiza wariancji) to wielowymiarowe techniki analizy zależności używane do określenia, czy istnieją znaczące różnice między średnimi trzech lub więcej grup populacji.
Dlatego dzięki tej analizie dowiemy się, czy istnieją różnice między niektórymi grupami, gdy modyfikujemy jedną lub więcej cech. Aby się tego dowiedzieć, posługujemy się wartością średniej danych.
Jego zastosowanie jest bardzo częste w dziedzinach takich jak ekonomia czy medycyna.
Poprzednie założenia analizy wariancji
Istnieje szereg warunków wstępnych do przeprowadzenia ANOVA, które powinny być znane. Są one niezbędne, aby wyniki były adekwatne.
- Po pierwsze, populacja musi mieć rozkład normalny. Mamy więc do czynienia z rodzajem kontrastu parametrycznego, ponieważ znane są populacyjne parametry średniej i odchylenia standardowego.
- Ponadto użyte próbki muszą być od siebie niezależne. Oznacza to, że modyfikacja jednego z nich nie musi wpływać na wartość pozostałych.
- Z drugiej strony wariancje badanych populacji muszą być równe. Nazywa się to homoskedastycznością.
Klasyfikacja modeli analizy wariancji
Do analizy modeli wariancji można wykorzystać trzy klasyfikacje przedstawione poniżej:
- Model z efektami stałymi: Populacje są normalne i różnią się tylko wartością ich odpowiednich średnich.
- Model efektów losowych: W tym przypadku dane mają hierarchię i od niej zależą różnice w populacji.
- Model efektów mieszanych: Mielibyśmy do czynienia z modelem będącym mieszanką dwóch poprzednich.
Przykład ANOVA: ważne pojęcia
Do przeprowadzenia ANOVA istnieją matematyczne równania o pewnej złożoności. Jednak w Economy-Wiki.com stawiamy na prostą ekonomię i dlatego korzystając z technologii pokażemy, jak można to zrobić w arkuszu kalkulacyjnym.
Wyobraźmy sobie, że chcemy wiedzieć, czy istnieją znaczące różnice między czytelnikami Economy-Wiki.com, w oparciu o powinowactwo ich stopnia naukowego z ekonomią.
Ostrzeżenie: dane, których użyjemy, są fikcyjne.
Musimy przejść do Dane, Analiza danych i wybierzemy analizę wariancji czynnika.
Ranga byłaby macierzą trzech grup. Bardziej interesujące może być późniejsze dołączenie nagłówków i nadanie pożądanego formatowania. W naszym przypadku z logo i kolorem niebieskim.
Widzimy, że istnieją pewne pojęcia, takie jak stopnie swobody i prawdopodobieństwo lub znaczenie. Pierwsza jest obliczana automatycznie i jest liczbą grup minus jeden. Drugi mówi nam, czy różnice są znaczące, czy nie.
Zwykle zaczynasz od akceptowanego poziomu zaufania. W ekonomii zwykle wynosi 95% (0,95), co wiąże się z istotnością 0,05 (1-0,095). Tak więc, jeśli prawdopodobieństwo lub wartość p jest poniżej przyjętej istotności, różnice są znaczące.
W tym przypadku wydaje się, że stopień nie wpływa na liczbę czytelników (istotność > 0,05). Dlatego analiza wariancji wydaje się wskazywać, że Economy-Wiki.com interesuje wszystkich, a nie tylko wyspecjalizowanych czytelników. Oczywiście są to dane fikcyjne, czy nie?