Dzisiejszy wykres z pewnością bardzo dobrze znany będzie wszystkim osobą mającym styczność ze statystyką. Wykres pudełkowy, bo to o nim mowa, jest wykresem, który w swojej standardowej formie pozwala na prezentacje 5 pozycyjnych miar rozkładu (mediany, kwartyli oraz wartości min i max). W Excelu 2016 można wstawić go automatycznie, korzystając z wbudowanego typu wykresu. W pozostałych wersjach trzeba stworzyć go ręcznie. Prześledźmy zatem kroki potrzebne do zbudowania wykresu.
Jak czytać wykres pudełkowy ?
Wykres pudełkowy tworzą:
Max - to maksymalna wartość jaka występuje w zbiorze danych
Min - to minimalna wartość jaka występuje w zbiorze danych
Mediana - wartość środkowa naszego zbioru, który jest uszeregowany w kolejności rosnącej (dzieli zbiór dokładnie na połowę)
Kwartyl 1 - wyznacza przedział, w którym występuje pierwsze 25% wszystkich obserwacji w zbiorze danych
Kwartyl 3 - wyznacza przedział, w którym występuje pierwsze 75% wszystkich obserwacji w zbiorze danych
(przy kwartylach również musimy uszeregować zbiór danych od najmniejszego do największego)
Jakie wnioski możemy wyciągnąć z wykresu ?
Badając 3 przykładowe zbiory danych A,B i C możemy określić:
- Położenie: jaki zakres wartości posiada nasz zbiór danych (czy wykres posiada wąsy tzn.wartości max i min)
- Rozproszenie: jak bardzo rozproszony jest nasz zbiór (czyli jak wysokie jest pudełko mierzone odległością pomiędzy Kwartlem3 a Kwartylem1 tzw. rozstęp ćwiartkowy lub odległością pomiędzy wart. max i min)
- Kształt: czy zbiór naszych danych jest symetryczny (odległości min i max od mediany są równe) lub asymetryczny (odległość max od mediany jest większa niż min od mediany - prawostronnie asymetryczny, odległość min od mediany jest większa niż max - lewostronnie asymetryczny)
Jak zbudować wykres ?
Do wykonania wykresu można skorzystać z jednej z dwóch funkcji KWARTYL.PRZEDZ.OTW w połączeniu z MAX i MIN lub KWARTYL.PRZEDZ.ZAMK. Wyniki jakie otrzymamy korzystając z tych dwóch funkcji będą różne. Dzieje się tak, gdyż w pierwszym przypadku, wyłączymy ze zbioru danych medianę aby obliczyć kwartyle (skutkiem czego wyliczone wartości kwartyli będą leżały "dalej" od mediany) lub też dodamy ją do zbioru danych korzystając z funkcji KWARTYL.PRZEDZ.ZAMK (wyliczone kwartyle będą bliżej mediany). Jeżeli ktoś chciałby bardziej zgłębić temat różnic pomiędzy wynikami wskazanych funkcji, to odsyłam do wpisu kolegi z zagranicy. W przypadku budowy naszego wykresu posłużymy się funkcją KWARTYL.PRZEDZ.ZAMK, dla której jako argument "Tablica" przyjmiemy zaznaczone dane, natomiast dla argumentu "Kwartyl" wybierzemy wartości od 0-4.
Następnie dla wyliczenia kwartyli, będziemy musieli wykonać obliczenia pomocnicze, za pomocą których zbudujemy wykres pudełkowy. W tym celu przepisujemy wartość kwartyla 1 do wiersza Q1 natomiast dla pozostałych pól obliczamy różnicę w stosunku do sąsiedniego wiersza np. dla wąs min=1-0, mediana= 2-1 itp.
Aby zbudować pudełko wykresu, zaznaczamy dane z wierszy od Q1 do Q3, stosując wykres kolumnowy skumulowany z opcją "Przełącz wiersz na kolumnę".
W kolejnym kroku zaznaczmy niebieską serię danych i ustawiamy jej kolor na brak wypełnienia a dla pozostałych serii wybieramy kolor np. biały z czarnym obramowaniem.
Pudełko mamy już gotowe, pozostaje tylko dodać wąsy, które utworzymy korzystając ze słupków błędu, o wartościach plusowych dla serii Q3 oraz minusowych dla serii Q1.