Wykres pudełkowy - co to jest, definicja i pojęcie

Spisie treści:

Anonim

Wykres pudełkowy, z angielskiego, wykres pudełkowy, jest reprezentacją zmiennej ilościowej lub jakościowej w celu szybkiej identyfikacji kwartyli zbioru danych.

Innymi słowy, wykres pudełkowy to wykres przedstawiający zmienną ilościową lub jakościową poprzez kwartyle.

W statystyce jest użytecznym narzędziem do reprezentowania zarówno dyskretnych, jak i ciągłych zbiorów danych.

Należy pamiętać, że zmienne jakościowe lub te, które mają reprezentować porządek lub kategorię, muszą zawsze być powiązane z indeksem liczbowym większym niż 0, aby mogły pojawić się na wykresie i można było obliczyć odpowiednie statystyki.

Wykres pudełkowy i histogram

Wykres skrzynkowy to nic innego jak histogram widziany z góry, i w ten sam sposób histogram to wykres skrzynkowy widziany z boku. Przykład można zobaczyć poniżej.

Pierwszą cechą wspólną dla obu wykresów jest minimum i maksimum zbioru danych. Słupki końcowe po myślnikach wskazują minimum (dolny pasek) i maksimum (górny pasek). Odstające byłyby reprezentowane poza zakresem maksimum i minimum. To znaczy poza kreskami po myślnikach. Możemy również znaleźć poziome wykresy skrzynkowe.

Na pierwszy rzut oka widać, że większość danych koncentruje się na obserwacjach w pobliżu minimum na obu wykresach. Wskazuje na to wykres skrzynkowy, w którym skrzynka jest bliżej minimum niż maksimum. Jeśli spojrzymy na histogram, zobaczymy, że najczęstszymi obserwacjami są obserwacje bliskie minimum i dalekie od maksimum.

Informacje o wykresie pudełkowym

Informacje dostarczane przez wykres pudełkowy są następujące:

  1. Dno pudełka to pierwszy kwartyl (Q1).
  2. Słupek pośrodku pudełka to mediana lub drugi kwartyl (Q2).
  3. Górna część pudełka to trzeci kwartyl (Q3).
  4. Zakres międzykwartylowy lub IQR byłby wysokością pudełka, czyli różnicą między Q3 a Q1.

Klawisz wykresu pudełkowego

Ta graficzna reprezentacja jest nazywana wykresem pudełkowym, ponieważ wygląda jak pudełko. Dlatego, aby zapamiętać ten wykres, musielibyśmy pomyśleć tylko o obiekcie kwadratowym lub pudełku.

Czytelnicy zaznajomieni z ceną aktywów finansowych dostrzegą większe podobieństwo do świecy. Świece, które widzisz w wycenie, to wykresy pudełkowe dostosowane do wybranego okna czasowego.

Zalety i wady fabuły pudełkowej

Wśród zalet i wad tego schematu znajdujemy:

Korzyść

  • Zglobalizowana wizja bezwzględnej częstotliwości zmiennej ilościowej lub jakościowej.
  • Znajomość minimum, maksimum i kwartyli zbioru danych bez konieczności ich obliczania.
  • Rozpoznawanie wartości ekstremalnych szybciej niż na histogramie, ponieważ wartości ekstremalne są oznaczone kółkami poza maksimum i minimum.

Niedogodności

  • Jeśli zestaw danych jest mały, wykonanie wykresu pudełkowego w celu wyrażenia tych danych utrudni zrozumienie.

Przykład wykresu pudełkowego

Przypuszczamy, że chcemy przedstawić liczbę rowerzystów, którzy przejeżdżają przez nasz dom w ciągu roku. Najpierw liczymy rowerzystów i zbieramy informacje w tabeli.

Za pomocą niektórych programów, takich jak R lub Excel, możemy wygenerować poniższy wykres.

Dzięki odwzorowaniu liczby rowerzystów na wykresie pudełkowym możemy szybko zorientować się, gdzie znajduje się mediana, pozostałe kwartyle, maksimum i minimum. W tym przypadku nie mamy danych nietypowych, ponieważ poza maksimum i minimum nie ma nic.

Stosowanie tego typu wykresów jest bardzo powszechne ze względu na ich prostotę i użyteczność w wielu dziedzinach poza finansami i ekonomią.