Obyvatelstvo vs ukázková směrodatná odchylka
Ve statistice se používá několik indexů k popisu souboru údajů odpovídající jeho centrální tendenci, rozptylu a skewness. Standardní odchylka je jedním z nejčastějších měřítek rozptylu dat od středu souboru dat.
Vzhledem k praktickým obtížím nebude možné při testování hypotézy využít data z celé populace. Proto využíváme datové hodnoty ze vzorků, abychom mohli vyvodit závěry o populaci. V takové situaci se nazývají odhadci, protože odhadují hodnoty parametrů populace.
Je nesmírně důležité používat inferenční odhady. Odhadovatel je považován za nezaujatý, pokud se očekávaná hodnota tohoto odhadce rovná parametru populace. Například průměr vzorku použijeme jako nezaujatý odhad pro průměr populace. (Matematicky lze ukázat, že očekávaná hodnota střední hodnoty vzorku se rovná střední hodnotě populace). V případě odhadu směrodatné odchylky populace je směrodatná odchylka vzorku také nestranným odhadcem.
Co je standardní odchylka populace?
Pokud lze vzít v úvahu údaje z celé populace (například v případě sčítání), je možné vypočítat směrodatnou odchylku populace. Pro výpočet směrodatné odchylky populace se nejprve vypočítají odchylky hodnot dat od průměrné populace. Kořenový střední čtverec (kvadratický průměr) odchylek se nazývá standardní odchylka populace.
Ve třídě 10 studentů lze snadno shromažďovat údaje o studentech. Pokud je na této populaci studentů testována hypotéza, není třeba používat vzorkové hodnoty. Například hmotnost 10 studentů (v kilogramech) se měří na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Pak je průměrná hmotnost deseti lidí (v kilogramech) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, což je 71 (v kilogramech). Toto je průměr populace.
Nyní pro výpočet standardní odchylky populace vypočítáme odchylky od průměru. Příslušné odchylky od průměru jsou (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 a (79 - 71) = 8. Součet čtverců odchylky je ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Standardní odchylka populace je √ (366/10) = 6,05 (v kilogramech). 71 je přesná průměrná hmotnost studentů třídy a 6.05 je přesná standardní odchylka hmotnosti od 71.
Co je standardní směrodatná odchylka?
Když se pro odhad parametrů populace použijí data ze vzorku (velikosti n), vypočte se standardní odchylka vzorku. Nejprve se vypočítají odchylky hodnot dat od střední hodnoty vzorku. Protože se průměrná hodnota vzorku používá místo průměrné populace (což je neznámé), není použití kvadratického průměru vhodné. Aby se vykompenzovalo použití průměrné hodnoty vzorku, je součet čtverců odchylek dělen (n-1) namísto n. Druhá standardní odchylka vzorku je druhou odmocninou. V matematických symbolech S = √ ∑ (xi-X)2 / (n-1), kde S je standardní směrodatná odchylka vzorku, ẍ je průměr vzorku a xijsou datové body.
Nyní předpokládejme, že v předchozím příkladu jsou populací studenti celé školy. Poté bude třída pouze ukázkou. Pokud je tento vzorek použit v odhadu, standardní směrodatná odchylka vzorku bude √ (366/9) = 6,38 (v kilogramech), protože 366 bylo vyděleno 9 místo 10 (velikost vzorku). Faktem je, že to není zaručeno, že to bude přesná hodnota standardní odchylky populace. Je to pouze odhad.
Jaký je rozdíl mezi standardní odchylkou populace a standardní směrodatnou odchylkou?? • Směrodatná odchylka populace je přesná hodnota parametru použitá k měření rozptylu od středu, zatímco směrodatná odchylka vzorku je pro ni objektivním odhadem.. • Směrodatná odchylka populace se vypočítá, když jsou známy všechna data týkající se každého jednotlivce populace. Jinak se vypočte směrodatná odchylka vzorku. • Směrodatná odchylka populace je dána σ = √ ∑ (xi-µ)2/ n kde µ je průměr populace a n je velikost populace, ale standardní směrodatná odchylka vzorku je dána S = √ ∑ (xi-ẍ)2 / (n-1) kde ẍ je průměr vzorku a n je velikost vzorku.
|