Błąd przeżycia - co to jest, definicja i koncepcja

Spisie treści:

Błąd przeżycia - co to jest, definicja i koncepcja
Błąd przeżycia - co to jest, definicja i koncepcja
Anonim

Błąd przeżycia to błąd, który pojawia się podczas zbierania danych, gdy dane są wykluczone z analizy, ponieważ dzisiaj już nie istnieją.

Ten błąd pojawia się w wielu różnych kontekstach, w których skupiamy się tylko na tych „przetrwałych” danych. Przykład tego widać, gdy firmy przeprowadzają ankietę wśród swoich klientów na temat jednego z ich produktów. Ale pozostawiają w niepamięci swoich nie-klientów, czyli w tym przypadku „nie-ocalonych”.

W tym przypadku wyciąganie wniosków z tego badania byłoby błędne. Ponieważ wyniki byłyby stronnicze tylko dla „przetrwałej” populacji. I nie byłyby to wyniki reprezentatywne.

Błąd przeżycia w praktyce

Wyraźny przykład tego nastawienia widać w badaniu wyników funduszy inwestycyjnych. Tam, gdzie większość baz danych zawiera tylko fundusze, które istnieją dzisiaj. Niezależnie od funduszy, które istniały w przeszłości.

Powodem, dla którego dzisiaj nie istnieją, jest to, że ich wydajność była gorsza niż „ocalonych”. Lub nawet kilka funduszy zostało połączonych w jeden. Dlatego analiza przeprowadzana jest na tych funduszach z najlepszymi wynikami. I to nastawienie prowadzi do przeszacowania wyników próby tych funduszy.

Głównym problemem nie jest już tylko przeszacowanie wyników funduszu. Wybrana próba nie byłaby raczej próbą losową całej populacji. A zatem wyniki badania mogą nie być reprezentatywne dla populacji. Że w końcu tego właśnie szukamy, wybierając losową próbę populacji.

Rozwiązanie problemu przetrwania

Wyobraźmy sobie, że chcemy wybrać fundusz inwestycyjny, w który będziemy inwestować, na podstawie jego wcześniejszych zachowań. Aby uniknąć tego błędu przetrwania i zoptymalizować ten wybór, powinniśmy wykonać następujące kroki:

  • Wybierz horyzont czasowy, z jakim planujemy pracować. Na przykład dziesięć, piętnaście czy dwadzieścia lat historii.
  • Weź wszystkie istniejące fundusze od początku horyzontu czasowego, niezależnie od tego, czy istnieją, czy nie.
  • Stamtąd wybierz próbkę z tej populacji do badania zachowania.

Ideą tego jest w końcu uzyskanie losowej próbki populacji. A stamtąd wyciągnięto wnioski, jeśli mogłyby być reprezentatywne dla tej populacji.