Analiza dużych ilości danych staje się znacznie prostsza, jeżeli zostaną one ukazane na przejrzystym wykresie. Jednym z nich jest histogram. Jeżeli chcesz dowiedzieć się, w jakich sytuacjach optymalnym rozwiązaniem będzie ten typ wykresu, przeczytaj tekst!
Histogram to typ wykresu, który znajduje swoje zastosowanie przede wszystkim podczas prowadzenia analiz statystycznych. Z drugiej jednak strony nic nie stoi na przeszkodzie, by z pomocą tego rodzaju wizualizacji przedstawić również dane biznesowe. W zależności od potrzeb mogą być to na przykład informacje na temat klientów detalicznych (cechy demograficzne, wielkość koszyka zakupowego itp.).
Histogram – kiedy się go stosuje?
Histogram jest jednym z rodzajów wykresu słupkowego. Poszczególne elementy (są czasem określane także jako kolumny) pokazują, jaka jest częstotliwość występowania danej cechy w badanej zbiorowości (populacji). Istotą tego sposobu przedstawienia danych jest podział badanej zbiorowości na klasy o równej szerokości. Analizowana populacja – lub wydzielona z niej próba – powinna zostać podzielona na przedziały.
W zależności od celu, jaki postawił sobie badacz dokonujący obserwacji, kryteria podziału mogą być bardzo różne. Aby jednak możliwa była sprawna interpretacja wyników, konieczne jest, by wykorzystywane do analizy dane liczbowe były podzielone według kryterium ilościowego. Rozumie się przez to na przykład wysokość wynagrodzenia czy wartość posiadanego majątku. Takie podejście umożliwia obiektywną obserwację analizowanych zjawisk.
Histogram może zostać wykorzystany w przedsiębiorstwie jako narzędzie diagnostyczne, aby dać obraz sytuacji w pewnym zakresie. Da się dzięki niemu przedstawić na przykład:
- rozkład dochodów – można wówczas pokazać, jaka część kadry pracowniczej w firmie, społeczności lokalnej lub branży osiąga dochody w określonym przedziale;
- poziom posiadanego majątku – dzięki temu można szybko ocenić, jaka część zbiorowości to klasa wyższa, a ile osób spośród badanej zbiorowości zalicza się do klasy średniej lub niższej,
- wysokość wydatków konsumpcyjnych – można wówczas porównać, jaka jest wysokość kosztów prowadzenia gospodarstwa domowego. Oczywiście, w celu zbadania struktury koszyka zakupowego konieczna będzie bardziej szczegółowa analiza.
O czym należy pamiętać podczas tworzenia histogramu?
Aby ten typ wykresu rzetelnie przedstawiał dane, należy pamiętać między innymi o właściwej szerokości przedziałów. Przykładem niech będzie poziom wynagrodzeń. Jeśli zamierzasz go przedstawić, należy wybrać takie przedziały dochodów, które pozwolą na wyszczególnienie osób na różnym etapie rozwoju zawodowego. Ustalenie dwóch przedziałów na poziomie 1–15000 zł oraz >15001 zł będzie błędem, ponieważ grupy te są zbyt obszerne. Zamiast tego zaleca się np. następujący podział – 1–2000 zł, 2001–3000 zł, 3001–4000 zł, …, 14001–15000 zł oraz >15001 zł.
Histogram – rodzaje
Prawidłowo przygotowany histogram pozwala na analizę zjawisk społecznych i gospodarczych. Z tego powodu jest on bardzo ważnym narzędziem z punktu widzenia statystyki. Już sama jego budowa, tzn. układ znajdujących się na nim danych, może dać cenne informacje w kwestii tego, czy występują w zbiorowości odchylenia od normy w badanym aspekcie.
Wyróżnia się między innymi następujące typy histogramów:
- pozbawiony wartości skrajnych – jest to wykres, do którego stworzenia wykorzystuje się dane po usunięciu wyników najbardziej skrajnych oraz losowych, tzn. zbyt wysokich lub niskich;
- podstawowy – w takim przypadku mamy do czynienia z równomiernym rozkładem danych. Jeśli chodzi o częstość występowania, to najliczniejsze są wyniki bliskie średniej, a im dalej od wartości uśrednionej, tym mniejsza liczebność. W statystyce taką sytuację określa się jako rozkład normalny. Histogram podstawowy jest czasem określany także jako typowy lub symetryczny;
- asymetryczny – wyraźnie wyższa liczba wyników występuje po lewej części lub prawej części histogramu;
- grzebieniowy – w takiej sytuacji nie ma wyraźnej tendencji pokazującej, czy analizowane dane liczbowe są generalnie niższe lub wyższe od średniej. Poszczególne słupki są wówczas naprzemiennie wysokie i niskie. Taki stan rzeczy może być spowodowany np. tym, że na rozkład danych wpływa kilka różnych czynników.
Jak tworzy się histogramy?
Obecnie tworzenie histogramów jest dość prostym zadaniem – wystarczy skorzystać z oprogramowania komputerowego. Może być to na przykład dedykowany system do badań statystycznych – jednym z najpopularniejszych rozwiązań, z pomocą których przedstawia się histogram, jest SPSS.
Oprócz tego możliwe jest skorzystanie np. z powszechnie stosowanego pakietu biurowego MS Office. Jeden z modułów wchodzących w jego skład – arkusz kalkulacyjny MS Excel – pozwala na szybkie tworzenie i modyfikowanie wykresów.
Histogram to często stosowana metoda analizy danych. Ilustruje ona, w jaki sposób rozkładają się dane w populacji. Przygotowanie wykresu z użyciem oprogramowania komputerowego jeszcze nie wszystko. Następnie należy zinterpretować uzyskane informacje w bardziej szczegółowy sposób.
- Estymacja w statystyce i ekonomii. Jakie są metody szacowania?
- Współczynnik zmienności – definicja, rodzaje, interpretacja
- Wykres Gantta, czyli skuteczne planowanie projektu. Jak to zrobić?
- DFD, czyli diagram przepływu danych – jak go tworzyć, co daje to narzędzie?
- Zasada Pareto 80/20 – na czym polega i jakie ma zastosowanie w praktyce?