Data slova se vztahují k informacím, které jsou shromažďovány a zaznamenávány. Může to být ve formě čísel, slov, měření a mnohem více.
Existují dva typy údajů, jedná se o kvalitativní údaje a kvantitativní údaje. Rozdíl mezi těmito dvěma typy dat spočívá v tom, že kvantitativní údaje se používají k popisu numerických informací. Například měření teploty by spadalo pod tento druh dat.
Na druhou stranu kvalitativní údaje se používají k popisu informací slovem. Po sběru dat je třeba uspořádat, a proto je třeba oddělit seskupená data od neseskupených dat. Obě jsou užitečné formy dat, ale rozdíl mezi nimi je v tom, že neseskupená data jsou nezpracovaná data. To znamená, že byl právě shromážděn, ale nebyl roztříděn do žádné skupiny nebo tříd. Na druhé straně, seskupená data jsou data, která byla uspořádána do skupin z prvotních dat.
Jak je uvedeno výše, seskupená data jsou typem dat, která jsou po sběru rozdělena do skupin. Nezpracovaná data jsou rozdělena do různých skupin a je vytvořena tabulka. Primárním účelem tabulky je ukázat datové body vyskytující se v každé skupině. Například po dokončení testu jsou výsledky data v tomto scénáři a existuje mnoho způsobů, jak tato data seskupit. Například lze zaznamenat počet studentů, kteří dosáhli skóre nad každou známkou 20.
Alternativně mohou být použity stupně. Například 90-100 až F 0-59 s každou kategorií ukazující počet studentů v každé kategorii. K zobrazení a interpretaci seskupených dat se nejlépe používají histogramy a frekvence. Zde je příklad
Seskupování dat má následující výhody:
Neseskupená data, která se také nazývají nezpracovaná data, jsou data, která po sběru nebyla zařazena do žádné skupiny nebo kategorie. Data jsou roztříděna do čísel nebo charakteristik, proto data, která nebyla uvedena v žádné z kategorií, jsou rozčleněna. Například při provádění sčítání lidu a chcete analyzovat, kolik žen ve věku nad 45 let je v určité oblasti, musíte nejprve vědět, kolik lidí žije v této oblasti.
Počet jednotlivců, kteří v této oblasti pobývají, jsou neseskupená data nebo nezpracované informace, protože nic nebylo kategorizováno. Můžeme tedy dojít k závěru, že neseskupená data jsou data použitá k zobrazení informací o jednotlivém členovi vzorku nebo populace.
Některé z výhod neseskupených dat jsou následující;
Seskupená data jsou data, která byla po analýze uspořádána do tříd. Příklady zahrnují, kolik pytlů kukuřice sebraných během období dešťů bylo špatných. Na druhé straně, neseskupená data jsou data, která nespadají do žádné skupiny. Jsou to stále nezpracovaná data.
Při sběru dat jsou upřednostňována neseskupená data, protože informace jsou stále v původní podobě. Nedocházelo k narušení klasifikace nebo členění. Při jejich analýze a kreslení grafů se však dává přednost seskupeným datům, protože je jednoduché je interpretovat.
Při výpočtu průměrů seskupených a neseskupených dat dojde ke změně. Průměr skupinových dat je upřednostňován, protože je přesnější ve srovnání s průměrem skupinových dat. Průměr nesdělených dat může vést ke špatné manipulaci se střední hodnotou, proto je ve většině případů považován za neefektivní.
Frekvenční tabulky se používají k zobrazení informací o seskupených datech, zatímco v případě neseskupených dat se informace jeví jako velký seznam čísel. Důvodem je skutečnost, že informace jsou stále nezpracované.
Seskupená data jsou data, která byla uspořádána do distribuce frekvence, zatímco neseskupená data nebyla nijak shrnuta.