Rozkład t-Studenta - co to jest, definicja i pojęcie

Spisie treści:

Anonim

Rozkład t-Studenta lub rozkład t jest modelem teoretycznym używanym do przybliżenia momentu pierwszego rzędu populacji o rozkładzie normalnym, gdy wielkość próby jest mała, a odchylenie standardowe jest nieznane.

Innymi słowy, rozkład t jest rozkładem prawdopodobieństwa, który szacuje wartość średniej małej próbki pobranej z populacji, która ma rozkład normalny i dla której nie znamy odchylenia standardowego.

Zalecane artykuły: stopnie swobody, stopnie swobody (przykład) i rozkład normalny.

Wzór na rozkład t-Studenta

Mając ciągłą zmienną losową L, mówimy, że częstość jej obserwacji może być zadowalająco przybliżona do rozkładu t z g stopni swobody, tak że:

Reprezentacja rozkładu t-Studenta

Funkcja gęstości rozkładu t z 3 stopniami swobody (df).

Jak widać, reprezentacja rozkładu t jest bardzo podobna do rozkładu normalnego, z wyjątkiem tego, że rozkład normalny ma szersze ogony i jest bardziej podparty. Innymi słowy, powinniśmy dodać więcej stopni swobody do rozkładu t, aby rozkład „rosł” i wyglądał bardziej jak rozkład normalny.

Specjalność

I… Dlaczego rozkład t jest tak wyjątkowy?

Cóż, ponieważ w przeciwieństwie do rozkładu normalnego, który zależy od średniej i wariancji, rozkład t zależy tylko od stopni swobody, z angielskiego, stopnie swobody (df). Innymi słowy, kontrolując stopnie swobody, kontrolujemy rozkład.

Aplikacja t studenta

Rozkład t jest używany, gdy:

  • Chcemy oszacować średnią populacji o rozkładzie normalnym z małej próby.
  • Wielkość próbki jest mniejsza niż 30 sztuk, czyli n <30.

Z 30 obserwacji rozkład t bardzo przypomina rozkład normalny, więc użyjemy rozkładu normalnego.

  • Odchylenie standardowe populacji nie jest znane i należy je oszacować na podstawie obserwacji próby.

Przykład

Zakładamy, że mamy 28 obserwacji zmiennej losowej G o rozkładzie t-Studenta z 27 stopniami swobody (df).

Matematycznie,

Ponieważ pracujemy z rzeczywistymi danymi, zawsze będzie błąd aproksymacji między danymi a dystrybucją. Innymi słowy, średnia, mediana i tryb nie zawsze będą równe zero (0) lub dokładnie takie same.

Częstość każdej obserwacji zmiennej G przedstawiamy za pomocą histogramu.

Czy zmienna losowa G może aproksymować rozkład t?

Powody, dla których należy uznać, że zmienna G ma rozkład t:

  • Rozkład jest symetryczny. Oznacza to, że po prawej i lewej stronie wartości środkowej znajduje się taka sama liczba obserwacji. Ponadto średnia i mediana są zbliżone do tej samej wartości. Średnia wynosi w przybliżeniu zero, średnia = 0,016.
  • Obserwacje z największą częstotliwością lub prawdopodobieństwem znajdują się wokół wartości centralnej. Obserwacje z mniejszą częstotliwością lub prawdopodobieństwem są dalekie od wartości centralnej.