Przedział ufności - Co to jest, definicja i pojęcie

Spisie treści:

Anonim

Przedział ufności to technika estymacji stosowana we wnioskowaniu statystycznym, która pozwala ograniczyć parę lub kilka par wartości, w ramach których zostanie znaleziona pożądana ocena punktowa (z pewnym prawdopodobieństwem).

Przedział ufności pozwoli nam obliczyć dwie wartości wokół średniej próbki (jedna górna i jedna dolna). Wartości te ograniczą zakres, w którym z pewnym prawdopodobieństwem będzie się znajdował parametr populacji.

Przedział ufności = średnia + - margines błędu

Ogólnie rzecz biorąc, poznanie prawdziwej populacji jest czymś bardzo skomplikowanym. Weź pod uwagę populację 4 milionów ludzi. Czy możemy znać średnie wydatki na konsumpcję na gospodarstwo domowe tej populacji? W zasadzie tak. Musielibyśmy po prostu zbadać wszystkie gospodarstwa domowe i obliczyć średnią. Jednak realizacja tego procesu byłaby niezwykle pracochłonna i skomplikowałaby badanie.

W takich sytuacjach łatwiej jest wybrać próbę statystyczną. Na przykład 500 osób. I na tej próbce oblicz średnią. Chociaż nadal nie znamy prawdziwej wartości populacji, możemy założyć, że będzie ona zbliżona do wartości próbki. Do tego dodajemy margines błędu i mamy wartość przedziału ufności. Z drugiej strony odejmiemy ten margines błędu od średniej i otrzymamy inną wartość. Pomiędzy tymi dwiema wartościami będzie średnia populacji.

Podsumowując, przedział ufności nie służy do oszacowania punktowego parametru populacji, jeśli ma nam pomóc w uzyskaniu przybliżonego wyobrażenia, który może być prawdziwy. Pozwala nam to ograniczyć między dwiema wartościami, w których będzie znajdować się średnia populacji.

Współczynnik zmiennościCzęstotliwość skumulowana

Czynniki, od których zależy przedział ufności

Obliczenie przedziału ufności zależy głównie od następujących czynników:

  • Wybrana wielkość próbki: W zależności od ilości danych, które zostały użyte do obliczenia wartości próbki, będzie ona mniej więcej zbliżona do rzeczywistego parametru populacji.
  • Poziom zaufania: Poinformuje nas, w jakim procencie przypadków nasze szacunki są prawidłowe. Zwykłe poziomy to 95% i 99%.
  • Margines błędu naszego szacunku: Nazywa się to alfa i informuje nas o prawdopodobieństwie, że wartość populacji jest poza naszym zakresem.
  • Oszacowanie w próbie (średnia, wariancja, różnica średnich …): Od tego będzie zależeć statystyka przestawna do obliczania interwału.

Przykład przedziału ufności dla średniej, przy założeniu normalności i znanego odchylenia standardowego

Statystyka przestawna użyta do obliczeń byłaby następująca:

Wynikowy przedział byłby następujący:

Widzimy, jak w przedziale na lewo i na prawo od nierówności mamy odpowiednio dolną i górną granicę. Dlatego wyrażenie mówi nam, że prawdopodobieństwo, że średnia populacji mieści się między tymi wartościami, wynosi 1-alfa (poziom ufności).

Przyjrzyjmy się bliżej powyższemu z ćwiczeniem rozwiązanym jako przykład.

Chcesz oszacować średni czas, jaki biegacz potrzebuje na ukończenie maratonu. W tym celu zmierzono 10 maratonów i uzyskano średnio 4 godziny z odchyleniem standardowym wynoszącym 33 minuty (0,55 godziny). Chcesz uzyskać 95% przedział ufności.

Aby uzyskać przedział, musielibyśmy jedynie podstawić dane we wzorze przedziałowym.

Przedział ufności byłby częścią rozkładu zacieniowaną na niebiesko. 2 wartości ograniczone przez to byłyby wartościami odpowiadającymi 2 czerwonym liniom. Linia środkowa dzieląca rozkład na 2 byłaby rzeczywistą wartością populacji.

Należy zauważyć, że w tym przypadku, biorąc pod uwagę, że funkcja gęstości rozkładu N (0,1) daje nam skumulowane prawdopodobieństwo (od lewej do wartości krytycznej), musimy znaleźć wartość, która pozostawia nam 0,975 na lewy % (to jest 1,96).