Standardní odchylka vs průměr
V popisné a inferenční statistice se používá několik ukazatelů k popisu souboru údajů odpovídající jeho centrální tendenci, rozptylu a skewness. Ve statistickém odvození, tito jsou obyčejně známí jako odhadci protože oni odhadují hodnoty parametrů populace.
Centrální tendence označuje a lokalizuje střed rozložení hodnot. Průměr, režim a medián jsou nejčastěji používanými indexy při popisu centrální tendence datového souboru. Disperze je množství šíření dat ze středu distribuce. Rozsah a směrodatná odchylka jsou nejčastěji používanými měřítky rozptylu. Pearsonovy koeficienty skewness se používají při popisu skewningu distribuce dat. Zde skewness odkazuje na to, zda je sada dat symetrická vůči středu nebo ne, a pokud ne, jak je zkosená.
Co to znamená?
Průměr je nejčastěji používaný index centrální tendence. Při dané sadě dat se průměr vypočítá tak, že se spočítá součet všech hodnot dat a poté se vydělí počtem dat. Například, hmotnost 10 lidí (v kilogramech) se měří na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Pak může být průměrná hmotnost deseti lidí (v kilogramech) vypočteno následovně. Součet hmotností je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Průměr = (součet) / (počet dat) = 710/10 = 71 (v kilogramech).
Stejně jako v tomto konkrétním příkladu nemusí být střední hodnota sady dat datovým bodem sady, ale bude jedinečná pro daný datový soubor. Průměr bude mít stejné jednotky jako původní data. Proto může být označen na stejné ose jako data a může být použit ve srovnání. Rovněž neexistuje žádné omezení znaménka pro průměr sady dat. Může to být záporné, nulové nebo kladné, protože součet datové sady může být záporný, nulový nebo kladný.
Co je standardní odchylka?
Standardní odchylka je nejčastěji používaný index disperze. Pro výpočet směrodatné odchylky se nejprve vypočítají odchylky hodnot dat od střední hodnoty. Kořenový čtvercový průměr odchylek se nazývá standardní odchylka.
V předchozím příkladu jsou příslušné odchylky od průměru (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 a (79-71) = 8. Součet čtverce odchylky je (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Standardní odchylka je √ (366/10) = 6,05 (v kilogramech). Z toho lze vyvodit závěr, že většina dat je v intervalu 71 ± 6,05, za předpokladu, že soubor dat není příliš zkosený, a je to tak v tomto konkrétním příkladu.
Protože směrodatná odchylka má stejné jednotky jako původní data, dává nám míru míry odchylky dat od středu; větší směrodatná odchylka větší disperze. Standardní odchylka bude také nezápornou hodnotou bez ohledu na povahu dat v sadě dat.
Jaký je rozdíl mezi standardní odchylkou a průměrnou hodnotou?? • Standardní odchylka je míra rozptylu od středu, zatímco střední hodnota měří umístění středu datové sady. • Standardní odchylka je vždy nezáporná hodnota, ale průměr může mít jakoukoli skutečnou hodnotu.
|