Rozkład t-Studenta - co to jest, definicja i pojęcie

Rozkład t-Studenta lub rozkład t jest modelem teoretycznym używanym do przybliżenia momentu pierwszego rzędu populacji o rozkładzie normalnym, gdy wielkość próby jest mała, a odchylenie standardowe jest nieznane.

Innymi słowy, rozkład t jest rozkładem prawdopodobieństwa, który szacuje wartość średniej małej próbki pobranej z populacji, która ma rozkład normalny i dla której nie znamy odchylenia standardowego.

Zalecane artykuły: stopnie swobody, stopnie swobody (przykład) i rozkład normalny.

Wzór na rozkład t-Studenta

Mając ciągłą zmienną losową L, mówimy, że częstość jej obserwacji może być zadowalająco przybliżona do rozkładu t z g stopni swobody, tak że:

Reprezentacja rozkładu t-Studenta

Funkcja gęstości rozkładu t z 3 stopniami swobody (df).

Jak widać, reprezentacja rozkładu t jest bardzo podobna do rozkładu normalnego, z wyjątkiem tego, że rozkład normalny ma szersze ogony i jest bardziej podparty. Innymi słowy, powinniśmy dodać więcej stopni swobody do rozkładu t, aby rozkład „rosł” i wyglądał bardziej jak rozkład normalny.

Specjalność

I… Dlaczego rozkład t jest tak wyjątkowy?

Cóż, ponieważ w przeciwieństwie do rozkładu normalnego, który zależy od średniej i wariancji, rozkład t zależy tylko od stopni swobody, z angielskiego, stopnie swobody (df). Innymi słowy, kontrolując stopnie swobody, kontrolujemy rozkład.

Aplikacja t studenta

Rozkład t jest używany, gdy:

  • Chcemy oszacować średnią populacji o rozkładzie normalnym z małej próby.
  • Wielkość próbki jest mniejsza niż 30 sztuk, czyli n <30.

Z 30 obserwacji rozkład t bardzo przypomina rozkład normalny, więc użyjemy rozkładu normalnego.

  • Odchylenie standardowe populacji nie jest znane i należy je oszacować na podstawie obserwacji próby.

Przykład

Zakładamy, że mamy 28 obserwacji zmiennej losowej G o rozkładzie t-Studenta z 27 stopniami swobody (df).

Matematycznie,

Ponieważ pracujemy z rzeczywistymi danymi, zawsze będzie błąd aproksymacji między danymi a dystrybucją. Innymi słowy, średnia, mediana i tryb nie zawsze będą równe zero (0) lub dokładnie takie same.

Częstość każdej obserwacji zmiennej G przedstawiamy za pomocą histogramu.

Czy zmienna losowa G może aproksymować rozkład t?

Powody, dla których należy uznać, że zmienna G ma rozkład t:

  • Rozkład jest symetryczny. Oznacza to, że po prawej i lewej stronie wartości środkowej znajduje się taka sama liczba obserwacji. Ponadto średnia i mediana są zbliżone do tej samej wartości. Średnia wynosi w przybliżeniu zero, średnia = 0,016.
  • Obserwacje z największą częstotliwością lub prawdopodobieństwem znajdują się wokół wartości centralnej. Obserwacje z mniejszą częstotliwością lub prawdopodobieństwem są dalekie od wartości centralnej.

Popularne Wiadomości

Większość krajów eksportujących na świecie

Na czele listy krajów o największym eksporcie na świecie znajdują się Chiny z 2098 miliardami dolarów, a następnie Stany Zjednoczone z 1471 i Niemcy z 1,283 miliardami dolarów. Z drugiej strony widzimy, że światowa gospodarka ma skumulowaną liczbę 15 723,20, z czego Unia Europejska stanowi prawie jedną trzecią (Czytaj więcej…

Największe banki w Ameryce Łacińskiej

W ramach finansowych Ameryki Łacińskiej Banco Itaú prowadzi w rankingu z kapitalizacją rynkową na poziomie 179,65 mld euro, za nim praktycznie bez różnicy są Banco Bradesco i Santander Brasil. W porównaniu z krajami Ameryki Łacińskiej wydaje się, że żaden kraj nie poradzi sobie z Brazylią, jeśli chodzi o pierwszą dziesiątkę.…

Większość produktów importowanych z Hiszpanii

W tym zestawieniu przedstawiamy listę dziesięciu najbardziej importowanych produktów z Hiszpanii, gdzie na pierwszym miejscu znalazły się pojazdy z 42,5 miliardami dolarów i 13,7% całości, a następnie z pewną odległością minerały z 32,8 miliardami dolarów i procentem 10,6%, a trzecią zamknęliśmyCzytaj więcej…