Normalizacja statystyczna to przekształcenie skali rozkładu zmiennej w celu umożliwienia porównań w odniesieniu do zbiorów elementów i średniej poprzez eliminację skutków oddziaływań.
Innymi słowy, normalizacja to proporcje bez jednostek miary (bezwymiarowe lub niezmienniki skali), które pozwalają nam porównywać elementy różnych zmiennych i różnych jednostek miary.
W statystyce i ekonometrii standaryzowane tabele rozkładu prawdopodobieństwa służą do znalezienia prawdopodobieństwa, że obserwacja przyjmie funkcję rozkładu, za którą podąża zmienna.
Ważne jest, aby nie ograniczać terminu normalizacji tylko do zbiorów elementów, których rozkład normalny jest dobrym przybliżeniem ich częstości.
Zmienna statystycznaStół
Poniższa tabela przedstawia najczęstsze standaryzacji w statystyce stosowanej w finansach i ekonomii.
- Wynik typizowany lub standardowy normalizuje błędy, gdy możemy obliczyć parametry próbki.
- Normalizacja w rozkładzie t-Studenta normalizuje reszty, gdy parametry są nieznane i dokonujemy oszacowania, aby je uzyskać.
- Współczynnik zmienności wykorzystuje średnią jako miarę skali, w przeciwieństwie do wyniku standaryzowanego i t-Studenta, które wykorzystują odchylenie standardowe. Rozkład jest znormalizowany dla rozkładu Poissona i wykładniczego.
- Standaryzowany moment można zastosować do dowolnego rozkładu prawdopodobieństwa, który ma funkcję generującą moment. Innymi słowy, że całki momentów są zbieżne.
Aplikacje
Ile razy czytaliśmy, że normalny rozkład prawdopodobieństwa wydaje się wystarczająco dobrym przybliżeniem częstości obserwacji i jesteśmy proszeni o znalezienie prawdopodobieństwa, że zmienna X przyjmie określoną wartość?
Innymi słowy, ustalamy X ~ N (μ, σ2) i mamy znaleźć P (X ≤ xja)
Wiemy, że aby znaleźć P (X ≤ xja), musimy sprawdzić prawdopodobieństwo w tabelach rozkładu prawdopodobieństwa. W tym przypadku w tabelach rozkładu normalnego. Najczęściej używane tabele rozkładu prawdopodobieństwa w ekonometrii i finansach ilościowych to: chi-kwadrat, t Studenta, F Fishera-Snedecora, Poissona, wykładniczy, Cauchy i standardowa normalna.
Obliczone w tabelach rozkładów prawdopodobieństwa spełniają właściwość:
Oznacza to, że prawdopodobieństwa (liczby w tabeli) są typizowane. Następnie będziemy musieli również wpisać naszą zmienną zgodnie z parametrami funkcji rozkładu, jeśli chcemy znaleźć prawdopodobieństwo P (X ≤ xja).
Praktyczny przykład
Chcemy poznać prawdopodobieństwo, że liczba narciarzy jeżdżących na nartach w piątek rano wynosi 288.
Ośrodek narciarski informuje nas, że częstość zmiennej narciarzy może być zbliżona do rozkładu normalnego średniej 280 i wariancji 16.
Więc mamy:
X ~ N (μ, σ2)
gdzie X jest zdefiniowane jako zmienna „narciarze”
Pytają nas o prawdopodobieństwo, że liczba narciarzy wybierających się na narty w piątek jest mniejsza lub równa 288. To znaczy:
P (X ≤ 288)
Proces
Aby znaleźć prawdopodobieństwo, że liczba narciarzy wynosi 288, najpierw musimy wpisać zmienną.
Następnie patrzymy na tablicę rozkładu ciągłej normy normalnej:
Z | 0 | 1 | 2 | 3 |
2,0 | 0,9772 | 0,9778 | 0,9783 | 0,9788 |
Prawdopodobieństwo, że 288 narciarzy będzie jeździć na nartach w piątek rano wynosi 97,72%, biorąc pod uwagę parametry średniej i wariancji.