Odchylka vs. standardní odchylka
Odchylka vs. standardní odchylka
V popisné a inferenční statistice se používá několik ukazatelů k popisu souboru údajů odpovídající jeho centrální tendenci, rozptylu a skewness. Ve statistickém odvození, tito jsou obyčejně známí jako odhadci protože oni odhadují hodnoty parametrů populace.
Disperze je míra šíření dat kolem středu datové sady. Standardní odchylka je jedním z nejčastěji používaných měřítek rozptylu. Při výpočtu standardní odchylky se berou v úvahu odchylky každého datového bodu od průměru. Lze tedy tvrdit, že standardní odchylka spolu s průměrem poskytne téměř dostatečný obraz o sadě dat.
Zvažte následující sadu dat. Hmotnosti 10 osob (v kilogramech) se měří na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Pak je průměrná hmotnost deseti lidí (v kilogramech) 71 (v kilogramech) ).
Co je to odchylka?
Ve statistice znamená odchylka množství, o které se jeden datový bod liší od pevné hodnoty, jako je průměr. Obecně platí, že k je pevná hodnota a x1,X2,… , Xn označují datovou sadu. Odchylka xj od k je definováno jako (xj- k).
Například ve výše uvedené sadě dat jsou příslušné odchylky od střední hodnoty (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 a (79 - 71) = 8.
Co je standardní odchylka?
Pokud lze vzít v úvahu údaje z celé populace (například v případě sčítání), je možné vypočítat směrodatnou odchylku populace. Pro výpočet směrodatné odchylky populace se nejprve vypočítají odchylky hodnot dat od průměrné populace. Kořenový střední čtverec (kvadratický průměr) odchylek se nazývá standardní odchylka populace. Ve symbolech σ = √ ∑ (xi-µ)2 / n kde µ je průměr populace a n je velikost populace.
Když se pro odhad parametrů populace použijí data ze vzorku (o velikosti n), vypočte se standardní odchylka vzorku. Nejprve se vypočítají odchylky hodnot dat od střední hodnoty vzorku. Protože se průměrná hodnota vzorku používá místo průměrné populace (což je neznámé), není použití kvadratického průměru vhodné. Aby se vykompenzovalo použití průměru vzorku, je součet čtverců odchylek dělen (n-1) namísto n. Druhá standardní odchylka vzorku je druhou odmocninou. V matematických symbolech S = √ ∑ (xi-X)2 / (n-1), kde S je standardní směrodatná odchylka vzorku, ẍ je průměr vzorku a xi jsou datové body.
V předchozím souboru dat je součet čtverců odchylky (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Standardní směrodatná odchylka je tedy √ (366/10) = 6,05 (v kilogramech). (Za předpokladu, že uvažovaná populace se skládá z 10 lidí, od nichž byly údaje převzaty).
Jaký je rozdíl mezi odchylkou a standardní odchylkou? • Standardní odchylka je statistický index a odhad, ale odchylka není. • Standardní odchylka je míra rozptylu shluku dat od středu, zatímco odchylka se týká množství, o které se jeden datový bod liší od pevné hodnoty.. |