Błąd typu I - Co to jest, definicja i pojęcie

Spisie treści:

Błąd typu I - Co to jest, definicja i pojęcie
Błąd typu I - Co to jest, definicja i pojęcie
Anonim

Błąd typu 1 w statystyce definiuje się jako odrzucenie hipotezy zerowej, gdy jest ona rzeczywiście prawdziwa. Błąd typu 1 jest również nazywany błędem fałszywie dodatnim lub błędem typu alfa.

Popełnienie błędu typu 1 to w zasadzie zaprzeczanie czemuś, gdy jest to rzeczywiście prawda. Rozważmy na przykład sytuację testowania, czy kampania marketingowa prowadzona na portalach społecznościowych zwiększa sprzedaż lodów dla firmy w letnim tygodniu. Hipotezy byłyby następujące:

H0: Sprzedaż nie rośnie dzięki letniej kampanii

H1: Wzrost sprzedaży dzięki kampanii marketingowej

Po ocenie ruchu na stronie firmy oraz podstronach odwiedzanych po zakończeniu kampanii wykrywane są:

  • Wzrost ruchu i odwiedzin o 50%.
  • 200% wzrost sprzedaży lodów.

W świetle tych wyników można było stwierdzić, że kampania reklamowa była owocna i wywołała efekt domina, zwiększając sprzedaż. Załóżmy jednak, że w tamtym tygodniu nastąpiła fala upałów przynosząca temperatury powyżej 40 stopni.

Znając to drugie, musielibyśmy wziąć pod uwagę czynnik wysokiej temperatury jako przyczynę wzrostu sprzedaży. Jeśli nie weźmiemy tego pod uwagę, możemy odrzucić naszą hipotezę zerową, gdy jest prawdziwa, to znaczy pomyślimy, że nasza kampania odniosła spektakularny sukces, podczas gdy w rzeczywistości przyczyną wzrostu sprzedaży był silny upał. Gdybyśmy doszli do tego wniosku, odrzucilibyśmy hipotezę zerową, gdy jest ona w rzeczywistości prawdziwa, a zatem popełnilibyśmy błąd typu 1.

Przyczyny błędu typu 1

Błąd typu 1 jest związany z istotnością kontrastu lub alfa, z błędem estymacji współczynników i może wystąpić z powodu 2 typowych naruszeń założeń wyjściowych regresji. To są:

  • Warunkowa heteroskedastyczność.
  • Korelacja szeregowa.

Regresja, która przedstawiałaby jakiekolwiek z poprzednich naruszeń, niedoszacowałaby błędu współczynników. Jeśli tak się stanie, nasze oszacowanie statystyki t będzie większe niż rzeczywista statystyka t. Te większe wartości statystyki t zwiększyłyby prawdopodobieństwo, że wartość znajdzie się w strefie odrzucenia.

Wyobraźmy sobie 2 sytuacje.

Sytuacja 1 (nieprawidłowe oszacowanie błędu)

  • Znaczenie: 5%
  • Wielkość próbki: 300 osób.
  • Krytyczna wartość: 1,96
  • B1: 1,5
  • Błąd oszacowania współczynnika: 0,5

T = 1,5 / 0,5 = 3

W ten sposób wartość wpadłaby w strefę odrzucenia i odrzucilibyśmy hipotezę zerową.

Sytuacja 2 (prawidłowe oszacowanie błędu)

  • Znaczenie: 5%
  • Wielkość próbki: 300 osób.
  • Krytyczna wartość: 1,96
  • B1: 1,5
  • Błąd oszacowania współczynnika: 1

T = 1,5 / 1 = 1,5

W ten sposób wartość znalazłaby się w strefie braku odrzucenia i nie odrzucalibyśmy hipotezy.

Na podstawie poprzednich przykładów sytuacja 1, w której błąd jest niedoszacowany, prowadziłaby nas do odrzucenia hipotezy zerowej, gdy w rzeczywistości jest ona prawdziwa, ponieważ jak widzimy w sytuacji 2 z prawidłowo oszacowanym błędem, nie odrzucalibyśmy hipotezy bycie prawdziwym.