Wariancja to miara rozproszenia, która reprezentuje zmienność serii danych w odniesieniu do jej średniej. Formalnie oblicza się ją jako sumę kwadratów reszt podzieloną przez sumę obserwacji.
Można go również obliczyć jako kwadrat odchylenia standardowego. Nawiasem mówiąc, resztę rozumiemy jako różnicę między wartością zmiennej w danym momencie a średnią wartością całej zmiennej.
Zobacz wszystkie miary dyspersjiZanim przyjrzymy się formule wariancji, musimy powiedzieć, że wariancja w statystyce jest bardzo ważna. Ponieważ choć jest to prosta miara, może dostarczyć wielu informacji o konkretnej zmiennej.
Wzór do obliczenia wariancji
Jednostką miary wariancji będzie zawsze jednostka miary odpowiadająca danym, ale podniesiona do kwadratu. Wariancja jest zawsze większa lub równa zero. Ponieważ reszty są podniesione do kwadratu, matematycznie niemożliwe jest, aby wariancja wyszła ujemnie. W ten sposób nie może być mniej niż zero.
Gdzie
- X: zmienna, na której ma być obliczona wariancja
- xja: numer obserwacji i zmiennej X. i może przyjmować wartości od 1 do n.
- n: liczba obserwacji.
- x̄: Jest to średnia zmiennej X.
Lub co to samo:
Dlaczego reszty są podnoszone do kwadratu?
Powód, dla którego reszty są do kwadratu, jest prosty. Gdyby nie były podniesione do kwadratu, suma reszt wynosiłaby zero. Jest własnością odpadów. Aby tego uniknąć, podobnie jak w przypadku odchylenia standardowego, są one podnoszone do kwadratu. Wynik jest jednostką miary, w której dane są mierzone, ale podniesione do kwadratu.
Na przykład, gdybyśmy mieli dane o zarobkach zbioru osób w euro, dane, które dają wariancję, byłyby wyrażone w euro kwadratowych. Aby interpretacja miała sens, obliczylibyśmy odchylenie standardowe i przeliczyli dane do euro.
- Odchylenie -> (2-3) = -1
- Odchylenie -> (4-3) = 1
- Odchylenie -> (2-3) = -1
- Odchylenie -> (4-3) = 1
- Odchylenie -> (2-3) = -1
- Odchylenie -> (4-3) = 1
Jeśli dodamy wszystkie odchylenia, wynik jest zerowy.
RangaJaka jest różnica między wariancją a odchyleniem standardowym?
Jednym z pytań, które można by zadać i nie bez powodu, byłaby różnica między wariancją a odchyleniem standardowym. W rzeczywistości mierzą to samo. Wariancja jest kwadratem odchylenia standardowego. Lub odwrotnie, odchylenie standardowe to pierwiastek kwadratowy z wariancji.
Odchylenie standardowe ma na celu umożliwienie pracy w początkowych jednostkach miary. Oczywiście, jak to jest normalne, można się zastanawiać, jaki jest pożytek z wariancji jako pojęcia? Otóż chociaż interpretacja wartości, którą zwraca nie daje nam wielu informacji, jej obliczenie jest niezbędne do uzyskania wartości innych parametrów.
Aby obliczyć kowariancję, potrzebujemy wariancji, a nie odchylenia standardowego, do obliczenia niektórych macierzy ekonometrycznych używana jest wariancja, a nie odchylenie standardowe. To kwestia komfortu pracy z danymi według jakich obliczeń.
Przykład obliczenia wariancji
Zamierzamy ukuć serię danych o płacach. Mamy pięć osób, każda z inną pensją:
Juan: 1500 euro
Pepe: 1200 euro
José: 1700 euro
Miguel: 1300 euro
Mateo: 1800 euro
Średnia pensja, której potrzebujemy do naszych obliczeń, wynosi ((1500 + 1200 + 1700 + 1300 + 1800) / 5) 1500 euro.
Ponieważ formuła wariancji w jej rozbitej formie jest sformułowana w następujący sposób:
Dowiemy się, że musi być tak obliczony, że:
Wynik to 52 000 euro do kwadratu. Należy pamiętać, że za każdym razem, gdy obliczamy wariancję, mamy do czynienia z kwadratami jednostek miary. Aby przeliczyć to na euro, w tym przypadku musielibyśmy wykonać odchylenie standardowe. Przybliżony wynik to 228 euro. Oznacza to, że średnio różnica między zarobkami różnych osób wyniesie 228 euro.