Variace vs. standardní odchylka
Variace je běžným jevem ve statistice, protože kdyby nedošlo k žádné změně dat, pravděpodobně bychom statistiku vůbec nepotřebovali. Variace je popisována jako rozptyl ve statistice, což je míra vzdálenosti hodnot od jejich střední hodnoty. Odchylka je malá nebo malá, pokud jsou hodnoty seskupeny blíže střední hodnotě. Standardní odchylka je dalším měřítkem pro popis rozdílu mezi očekávanými výsledky a jejich skutečnými hodnotami. Ačkoli obě úzce souvisí, existují rozdíly mezi rozptyly a směrodatnými odchylkami, které budou popsány v tomto článku.
Nezpracované hodnoty v jakékoli distribuci nemají smysl a nemůžeme z nich odvodit žádné smysluplné informace. Právě pomocí standardní odchylky jsme schopni ocenit význam hodnoty, protože nám říká, jak daleko jsme od střední hodnoty. Varianta je v koncepci podobná standardní odchylce s tou výjimkou, že se jedná o druhou mocninu hodnoty SD. Má smysl pochopit koncepty rozptylu a směrodatné odchylky pomocí příkladu.
Předpokládejme, že farmář pěstuje dýně. Má deset dýní různých hmotností, které jsou následující.
2,6, 2,6, 2,8, 3,0, 3,1, 3,2, 3,3, 3,5, 3,6, 3,8. Je snadné vypočítat průměrnou hmotnost dýní, protože je součtem všech hodnot vydělených 10. V tomto případě je to 3,15 liber. Žádná z dýní však váží tolik a liší se hmotností v rozmezí od 0,55 libry lehčí do 0,65 libry těžší než průměr. Nyní můžeme zapsat rozdíl každé hodnoty od průměru následujícím způsobem
-0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65.
Co z těchto rozdílů vyvodit ze střední hodnoty. , Pokud se pokusíme najít průměrný rozdíl, vidíme, že nemůžeme najít střední hodnotu, jako při sčítání, záporné hodnoty se rovnají kladným hodnotám a průměrný rozdíl tedy nelze vypočítat. To je důvod, proč bylo rozhodnuto umocnit všechny hodnoty před jejich sčítáním a nalezením střední hodnoty. V tomto případě se čtvercové hodnoty zobrazují následovně
0,3025, 0,3025, 0,1225, 0,0225, 0,0025, 0,0025, 0,1225, 0,2025, 0,4225.
Nyní mohou být tyto hodnoty přičteny a vyděleny desítkou, aby bylo dosaženo hodnoty známé jako rozptyl. Tento rozptyl je v tomto příkladu 0,1525 liber. Tato hodnota nemá příliš velký význam, protože jsme před tím, než jsme zjistili jejich střední hodnotu, rozložili rozdíl na druhou. Proto musíme najít druhou odmocninu rozptylu, abychom dospěli ke standardní odchylce. V tomto případě je to 0,3905 liber.
Stručně: • Rozptyl i směrodatná odchylka jsou měřítkem šíření hodnot v jakýchkoli datech. • Varianta se vypočítá tak, že se vypočte průměr čtverců jednotlivých rozdílů od průměru vzorku • Standardní odchylka je druhá odmocnina rozptylu.
|