Wykres pudełkowy, z angielskiego, wykres pudełkowy, jest reprezentacją zmiennej ilościowej lub jakościowej w celu szybkiej identyfikacji kwartyli zbioru danych.
Innymi słowy, wykres pudełkowy to wykres przedstawiający zmienną ilościową lub jakościową poprzez kwartyle.
W statystyce jest użytecznym narzędziem do reprezentowania zarówno dyskretnych, jak i ciągłych zbiorów danych.
Należy pamiętać, że zmienne jakościowe lub te, które mają reprezentować porządek lub kategorię, muszą zawsze być powiązane z indeksem liczbowym większym niż 0, aby mogły pojawić się na wykresie i można było obliczyć odpowiednie statystyki.
Wykres pudełkowy i histogram
Wykres skrzynkowy to nic innego jak histogram widziany z góry, i w ten sam sposób histogram to wykres skrzynkowy widziany z boku. Przykład można zobaczyć poniżej.
Pierwszą cechą wspólną dla obu wykresów jest minimum i maksimum zbioru danych. Słupki końcowe po myślnikach wskazują minimum (dolny pasek) i maksimum (górny pasek). Odstające byłyby reprezentowane poza zakresem maksimum i minimum. To znaczy poza kreskami po myślnikach. Możemy również znaleźć poziome wykresy skrzynkowe.
Na pierwszy rzut oka widać, że większość danych koncentruje się na obserwacjach w pobliżu minimum na obu wykresach. Wskazuje na to wykres skrzynkowy, w którym skrzynka jest bliżej minimum niż maksimum. Jeśli spojrzymy na histogram, zobaczymy, że najczęstszymi obserwacjami są obserwacje bliskie minimum i dalekie od maksimum.
Informacje o wykresie pudełkowym
Informacje dostarczane przez wykres pudełkowy są następujące:
- Dno pudełka to pierwszy kwartyl (Q1).
- Słupek pośrodku pudełka to mediana lub drugi kwartyl (Q2).
- Górna część pudełka to trzeci kwartyl (Q3).
- Zakres międzykwartylowy lub IQR byłby wysokością pudełka, czyli różnicą między Q3 a Q1.
Klawisz wykresu pudełkowego
Ta graficzna reprezentacja jest nazywana wykresem pudełkowym, ponieważ wygląda jak pudełko. Dlatego, aby zapamiętać ten wykres, musielibyśmy pomyśleć tylko o obiekcie kwadratowym lub pudełku.
Czytelnicy zaznajomieni z ceną aktywów finansowych dostrzegą większe podobieństwo do świecy. Świece, które widzisz w wycenie, to wykresy pudełkowe dostosowane do wybranego okna czasowego.
Zalety i wady fabuły pudełkowej
Wśród zalet i wad tego schematu znajdujemy:
Korzyść
- Zglobalizowana wizja bezwzględnej częstotliwości zmiennej ilościowej lub jakościowej.
- Znajomość minimum, maksimum i kwartyli zbioru danych bez konieczności ich obliczania.
- Rozpoznawanie wartości ekstremalnych szybciej niż na histogramie, ponieważ wartości ekstremalne są oznaczone kółkami poza maksimum i minimum.
Niedogodności
- Jeśli zestaw danych jest mały, wykonanie wykresu pudełkowego w celu wyrażenia tych danych utrudni zrozumienie.
Przykład wykresu pudełkowego
Przypuszczamy, że chcemy przedstawić liczbę rowerzystów, którzy przejeżdżają przez nasz dom w ciągu roku. Najpierw liczymy rowerzystów i zbieramy informacje w tabeli.
Za pomocą niektórych programów, takich jak R lub Excel, możemy wygenerować poniższy wykres.
Dzięki odwzorowaniu liczby rowerzystów na wykresie pudełkowym możemy szybko zorientować się, gdzie znajduje się mediana, pozostałe kwartyle, maksimum i minimum. W tym przypadku nie mamy danych nietypowych, ponieważ poza maksimum i minimum nie ma nic.
Stosowanie tego typu wykresów jest bardzo powszechne ze względu na ich prostotę i użyteczność w wielu dziedzinach poza finansami i ekonomią.