Rozkład normalny jest modelem teoretycznym zdolnym do zadowalającego przybliżenia wartości zmiennej losowej do sytuacji idealnej.
Innymi słowy, rozkład normalny dopasowuje zmienną losową do funkcji, która zależy od średniej i odchylenia standardowego. Oznacza to, że funkcja i zmienna losowa będą miały tę samą reprezentację, ale z niewielkimi różnicami.
Ciągła zmienna losowa może przyjmować dowolną liczbę rzeczywistą. Na przykład zwroty akcji, wyniki testów, IQ i błędy standardowe są ciągłymi zmiennymi losowymi.
Dyskretna zmienna losowa przyjmuje wartości naturalne. Na przykład liczba studentów na uniwersytecie.
Rozkład normalny jest podstawą dla innych rozkładów, takich jak rozkład t-Studenta, rozkład chi-kwadrat, rozkład Fishera i inne rozkłady.
Wzór na rozkład normalny
Mając zmienną losową X, mówimy, że częstość jej obserwacji można w sposób zadowalający przybliżyć do rozkładu normalnego takiego, że:
Gdzie parametrami rozkładu są wartość średnia lub centralna oraz odchylenie standardowe:
Innymi słowy, mówimy, że częstość zmiennej losowej X może być reprezentowana przez rozkład normalny.
Reprezentacja
Funkcja gęstości prawdopodobieństwa zmiennej losowej o rozkładzie normalnym.
Nieruchomości
- Jest to rozkład symetryczny. Wartość średniej, mediany i modu pokrywają się. Matematycznie,
Średnia = Mediana = Tryb
- Dystrybucja jednomodalna. Wartości, które są częstsze lub bardziej prawdopodobne, są w okolicach średniej. Innymi słowy, gdy odchodzimy od średniej, maleje prawdopodobieństwo pojawienia się wartości i ich częstotliwości.
Czego potrzebujemy do reprezentowania rozkładu normalnego?
- Zmienna losowa.
- Oblicz średnią.
- Oblicz odchylenie standardowe.
- Zdecyduj, jaką funkcję chcemy reprezentować: funkcję gęstości prawdopodobieństwa lub funkcję rozkładu.
Przykład teoretyczny
Zakładamy, że chcemy wiedzieć, czy wyniki testu mogą zadowalająco przybliżać rozkład normalny.
Wiemy, że w teście uczestniczy 476 uczniów, a wyniki mogą wynosić od 0 do 10. Obliczamy średnią i odchylenie standardowe z obserwacji (wyników testu).
Tak więc definiujemy zmienną losową X jako wyniki testu, które zależą od każdego indywidualnego wyniku. Matematycznie,
Wynik każdego ucznia jest zapisywany w tabeli. W ten sposób uzyskamy globalną wizję wyników i ich częstotliwości.
Wyniki | Częstotliwość |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
CAŁKOWITY | 476 |
Po sporządzeniu tabeli przedstawiamy wyniki badania i częstotliwości. Jeżeli wykres wygląda jak poprzedni obraz i spełnia właściwości, to zmienną wyników testu można zadowalająco przybliżyć do rozkładu normalnego o średniej 4,8 i odchyleniu standardowym 3,09.
Czy wyniki testu mogą być zbliżone do rozkładu normalnego?
Przyczyny uznania, że zmienna wyników testu ma rozkład normalny:
- Rozkład symetryczny. Oznacza to, że po prawej i lewej stronie wartości środkowej znajduje się taka sama liczba obserwacji. Ponadto średnia, mediana i tryb mają tę samą wartość.
Średnia = Mediana = Tryb = 5
- Obserwacje z największą częstotliwością lub prawdopodobieństwem znajdują się wokół wartości centralnej. Innymi słowy, obserwacje z mniejszą częstotliwością lub prawdopodobieństwem są dalekie od wartości centralnej.
Rozkład normalny opisuje zmienną losową przez przybliżenie, które daje błędy standardowe (słupki nad każdą kolumną). Błędy te to różnica między rzeczywistymi obserwacjami (wyniki) a funkcją gęstości (rozkład normalny).