Ukázka vs Obyvatelstvo
Obyvatelstvo a vzorek jsou dva důležité pojmy v předmětu Statistika. Zjednodušeně řečeno, populace je největší sbírkou předmětů, o které máme zájem, a vzorek je podmnožinou populace. Jinými slovy, vzorek by měl představovat populaci s menším, ale dostatečným počtem položek. Jedna populace může mít několik vzorků s různými velikostmi.
Vzorek
Vzorek se může skládat ze dvou nebo více položek, které byly vybrány z populace. Nejnižší možná velikost vzorku je dvě a nejvyšší by se rovnalo velikosti populace. Existuje několik způsobů, jak vybrat vzorek z populace. Teoreticky je výběr „náhodného vzorku“ nejlepším způsobem, jak dosáhnout přesných závěrů o populaci. Tento typ vzorků se také nazývá pravděpodobnostní vzorky, protože každá položka v populaci má stejnou příležitost být zahrnuta do vzorku.
Technika „jednoduchého náhodného vzorkování“ je nejznámější technika náhodného vzorkování. V tomto případě jsou položky vybrané pro vzorek vybrány náhodně z populace. Takový vzorek se nazývá „jednoduchý náhodný vzorek“ nebo SRS. Další populární technikou je „systematický odběr vzorků“. V tomto případě jsou položky pro vzorek vybrány na základě konkrétního systematického pořadí.
Příklad: Jako vzorek je vybrána každá 10. osoba ve frontě.
V tomto případě je systematickým pořádkem každá 10. osoba. Statistik může definovat tento řád smysluplným způsobem. Existují i jiné techniky náhodného odběru vzorků, jako je vzorkování shluků nebo stratifikovaný odběr vzorků, a způsob výběru se mírně liší od výše uvedených dvou.
Pro praktické účely mohou být použity náhodné vzorky, jako jsou vzorky pohodlí, vzorky úsudku, vzorky sněhové koule a účelové vzorky. Navíc položky vybrané k náhodným vzorkům náleží šanci. Ve skutečnosti každá položka populace nemá stejnou příležitost být zahrnuta do náhodných vzorků. Tyto typy vzorků se také nazývají vzorky bez pravděpodobnosti.
Populace
Jakákoli sbírka subjektů, které je zajímavé zkoumat, je jednoduše definována jako „populace“. Základem vzorků jsou populace. Jakákoli sada objektů ve vesmíru může být populací na základě prohlášení o studiu. Obecně by populace měla být poměrně velká a měla by se těžko odvodit některé charakteristiky tím, že budou zvažovat její položky individuálně. Měření, která se mají zkoumat v populaci, se nazývají parametry. V praxi jsou parametry odhadovány pomocí statistik, které jsou příslušnými měřeními vzorku.
Příklad: Při odhadu průměrné matematické značky 30 studentů ve třídě ze známek průměrné matematiky 5 studentů je parametrem průměrná matematická známka třídy. Statistika je průměrná matematická známka 5 studentů.
Ukázka vs Obyvatelstvo
Zajímavý vztah mezi vzorkem a populací je, že populace může existovat bez vzorku, ale vzorek nemusí existovat bez populace. Tento argument dále dokazuje, že vzorek závisí na populaci, ale zajímavé je, že většina populačních inferencí závisí na vzorku. Hlavním účelem vzorku je odhadnout nebo odvodit některá měření populace co nejpřesnější. Vyšší přesnost lze odvodit z celkového výsledku získaného z několika vzorků téže populace spíše než z jednoho vzorku. Další důležitou věcí, kterou je třeba vědět, je, že při výběru více než jednoho vzorku z populace může být jedna položka také zahrnuta do jiného vzorku. Tento případ se nazývá „vzorky s náhradami“. Investice příslušných měření populace ze vzorku a získání téměř podobného výkonu je navíc další příležitost, jak ušetřit náklady a čas..
Je důležité vědět, že když se velikost vzorku zvětšuje, zvyšuje se také přesnost odhadu pro parametr populace. Logicky, aby měly lepší odhady pro populaci, velikost vzorku by neměla být příliš malá. Dále by se také mělo za to, že náhodné vzorky mají lepší odhady. Proto je nezbytné věnovat pozornost velikosti a náhodnosti vzorku, který bude reprezentativní, aby bylo možné získat nejlepší odhady pro populaci.