Stratifikovaný vzorkování vs. vzorkování klastrů
Ve statistikách, zejména při provádění průzkumů, je důležité získat nezaujatý vzorek, takže výsledek a předpovědi týkající se populace jsou přesnější. Ale v jednoduchém náhodném výběru vzorků existuje možnost vybrat členy vzorku, který je zaujatý; jinými slovy, nepředstavuje populaci spravedlivě. Proto se pro překonání problémů s předpojatostí a efektivitou jednoduchého náhodného vzorkování používají vrstvené a skupinové vzorkování.
Stratifikovaný vzorkování
Stratifikovaný náhodný výběr je metoda vzorkování, ve které je populace nejprve rozdělena do vrstev (vrstva je homogenní podskupina populace). Poté je z každé vrstvy odebrán jednoduchý náhodný vzorek. Výsledky z každé kombinované vrstvy tvoří vzorek. Následují příklady možných vrstev v populacích
• Pro populaci státu, mužské a ženské vrstvy
• Pro lidi pracující ve městě, rezidentní a nerezidentní vrstvy
• Pro studenty na vysoké škole, bílé, černé, hispánské a asijské vrstvy
• Pro posluchače debaty týkající se teologie, protestantské, katolické, židovské, muslimské vrstvy
V tomto procesu je populace namísto náhodného výběru vzorků přímo z populace rozdělena do skupin pomocí vlastní vlastnosti prvků (homogenní skupiny). Poté jsou ze skupiny odebrány náhodné vzorky. Množství náhodných vzorků odebraných z každé skupiny závisí na počtu prvků ve skupině.
To umožňuje provádět odběr vzorků bez toho, aby byl vzorek jedné skupiny větší než počet vzorků požadovaných z této konkrétní skupiny. Pokud je počet prvků z určité skupiny větší než požadované množství, může zkreslení v distribuci vést k chybným interpretacím.
Vrstvený odběr vzorků umožňuje použití různých statistických metod pro každou vrstvu, což pomáhá zlepšit účinnost a přesnost odhadu.
Vzorek klastru
Shlukový náhodný výběr je metoda vzorkování, ve které je populace nejprve rozdělena do klastrů (Klastr je heterogenní podskupina populace). Poté se odebere jednoduchý náhodný vzorek shluků. Vzorek tvoří všichni členové vybraných klastrů. Tato metoda se často používá, když jsou přirozená seskupení zřejmá a dostupná.
Například zvažte průzkum pro vyhodnocení zapojení středoškolských studentů do mimoškolních aktivit. Spíše než výběr náhodných studentů ze studentské populace, výběr třídy jako vzorků pro průzkum je skupinový výběr. Poté se vede rozhovor s každým členem třídy. V tomto případě jsou třídy shluky studentské populace.
Při vzorkování klastrů jsou náhodně vybrány klastry, nikoli jednotlivci. Předpokládá se, že každý klastr sám o sobě je nezaujatým zastoupením populace, což znamená, že každý ze shluků je heterogenní.
Jaký je rozdíl mezi stratifikovaným vzorkováním a vzorkováním klastru?
• Ve stratifikovaném vzorkování je populace rozdělena do homogenních skupin nazývaných vrstvy, pomocí atributu vzorků. Poté jsou vybrány členy z každé vrstvy a počet vzorků odebraných z těchto vrstev je úměrný přítomnosti vrstev v populaci..
• Ve vzorkování shluků je populace seskupena do shluků, převážně na základě umístění, a pak je náhodně vybrán shluk..
• Ve vzorkování klastru je klastr vybrán náhodně, zatímco ve stratifikovaných vzorcích jsou členy vybrány náhodně.
• Ve stratifikovaném vzorkování každá použitá skupina (vrstvy) zahrnuje homogenní členy, zatímco ve vzorkování klastru je klastr heterogenní.
• Vrstvené vzorkování je pomalejší, zatímco vzorkování clusterů je relativně rychlejší.
• Vrstvené vzorky mají méně chyb kvůli faktoringu v přítomnosti každé skupiny v rámci populace a přizpůsobení metod k získání lepšího odhadu.
• Vzorkování klastru má vlastní vyšší procento chyb.