Úvod
Standard Dvystěhování (SD) a Sstandardní Error (SE) jsou zdánlivě podobné terminologie; jsou však koncepčně tak rozmanité, že se v statistice statistik používají téměř zaměnitelně. Oběma termíny obvykle předchází symbol plus-mínus (+/-), což svědčí o tom, že definují symetrickou hodnotu nebo představují rozsah hodnot. Vždy se oba termíny objevují s průměrem (průměrem) sady měřených hodnot.
Je zajímavé, že SE nemá nic společného s normami, s chybami nebo s předáváním vědeckých údajů.
Podrobný pohled na původ a vysvětlení SD a SE odhalí, proč profesionální statistici a ti, kteří jej používají kurzorově, mají sklon se mýlit.
Standardní odchylka (SD)
SD je a popisný statistika popisující šíření distribuce. Jako metrika je užitečné, když jsou data normálně distribuována. Je však méně užitečné, když jsou data velmi zkosená nebo bimodální, protože velmi dobře nepopisuje tvar distribuce. Obvykle používáme SD při vykazování charakteristik vzorku, protože to máme v úmyslu popsat jak moc se data mění kolem průměru. Další užitečné statistiky pro popis šíření dat jsou mezikvartilový rozsah, 25. a 75. percentil a rozsah dat.
Obrázek 1. SD je měřítkem šíření dat. Pokud jsou data vzorkem z normálně distribuované distribuce, pak se očekává, že dvě třetiny dat budou ležet v rámci jedné standardní odchylky od střední hodnoty.
Varianta je popisný statistika také a je definována jako čtverec standardní odchylky. Při popisu výsledků se obvykle neuvádí, ale je to více matematicky sledovatelný vzorec (a.k.a. součet čtvercových odchylek) a hraje roli při výpočtu statistik.
Například pokud máme dvě statistiky P & Q se známými odchylkami var(P) & var(Q), pak rozptyl součtu P + Q se rovná součtu variací: var(P) +var(Q). Nyní je zřejmé, proč statistici rádi mluví o rozptylech.
Standardní odchylky však mají pro šíření důležitý význam, zejména pokud jsou data normálně distribuována: Průměr intervalu +/ - 1 SD lze očekávat, že zachytí 2/3 vzorku a střední interval +- 2 SD lze očekávat, že zachytí 95% vzorku.
SD poskytuje informaci o tom, do jaké míry se jednotlivé odpovědi na otázku liší nebo „odchylují“ od průměru. SD říká badateli, jak jsou rozptýleny odpovědi - jsou soustředěny kolem průměru nebo jsou rozptýleny daleko a široko? Posoudili všichni vaši respondenti váš produkt uprostřed vaší stupnice, nebo ho někteří schválili a někteří neschválili?
Zvažte experiment, ve kterém jsou respondenti požádáni, aby hodnotili produkt podle řady atributů v pětibodové stupnici. Průměr pro skupinu deseti respondentů (označených „A“ až „J“ níže) pro „dobrou hodnotu za peníze“ byl 3,2 s SD 0,4 a průměr pro „spolehlivost produktu“ 3,4 s SD s 2,1.
Na první pohled (při pohledu pouze na prostředky) by se zdálo, že spolehlivost byla hodnocena vyšší než hodnota. Vyšší SD pro spolehlivost však může naznačovat (jak je znázorněno v níže uvedeném rozdělení), že odpovědi byly velmi polarizované, kde většina respondentů neměla žádné problémy se spolehlivostí (hodnocena atributem „5“), ale menší, ale důležitý segment respondentů měl problém se spolehlivostí a označil atribut „1“. Při pohledu na samotný průměr se vypráví pouze část příběhu, nicméně častěji než ne se na to vědci zaměřují. Rozdělení odpovědí je důležité zvážit a SD poskytuje hodnotné popisné opatření.
Odpůrce | Dobrá hodnota za peníze | Spolehlivost produktu |
A | 3 | 1 |
B | 3 | 1 |
C | 3 | 1 |
D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
Já | 3 | 5 |
J | 3 | 5 |
Znamenat | 3.2 | 3.4 |
Std. Dev. | 0,4 | 2.1 |
První průzkum: Respondenti hodnotí produkt na 5 bodové stupnici
Dvě velmi odlišné distribuce odpovědí na 5-bodovou hodnotící stupnici mohou poskytnout stejný průměr. Zvažte následující příklad ukazující hodnoty odpovědí pro dvě různá hodnocení.
V prvním příkladu (hodnocení „A“) je SD nulová, protože VŠECHNY odpovědi byly přesně střední hodnotou. Jednotlivé reakce se nelišily od střední hodnoty.
V hodnocení „B“, i když průměr skupiny je stejný (3.0) jako první rozdělení, je standardní odchylka vyšší. Standardní odchylka 1,15 ukazuje, že jednotlivé reakce v průměru * byly o něco více než 1 bod od střední hodnoty.
Odpůrce | Hodnocení „A“ | Hodnocení „B“ |
A | 3 | 1 |
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 | 3 |
H | 3 | 4 |
Já | 3 | 4 |
J | 3 | 5 |
Znamenat | 3.0 | 3.0 |
Std. Dev. | 0,00 | 1.15 |
Druhý průzkum: Respondenti hodnotí produkt na 5 bodové stupnici
Dalším způsobem pohledu na SD je vykreslení distribuce jako histogramu odpovědí. Distribuce s nízkou SD by se zobrazila jako vysoký úzký tvar, zatímco velká SD by byla označena širším tvarem.
SD obecně neoznačuje „správné nebo špatné“ nebo „lepší či horší“ - nižší SD nemusí být nutně žádoucí. Používá se čistě jako popisná statistika. Popisuje rozdělení ve vztahu k průměru.
Technické zřeknutí se odpovědnosti týkající se SD
Považovat SD za „průměrnou odchylku“ je vynikající způsob, jak koncepčně pochopit jeho význam. Ve skutečnosti se však nepočítá jako průměr (pokud by tomu tak bylo, říkali bychom tomu „průměrná odchylka“). Místo toho je „standardizovaný“, poněkud složitá metoda výpočtu hodnoty pomocí součtu čtverců.
Pro praktické účely není výpočet důležitý. Většina tabulkových programů, tabulek nebo jiných nástrojů pro správu dat vypočítá SD za vás. Důležitější je pochopit, co statistiky sdělují.
Standardní chyba
Standardní chyba je inferenciální statistika, která se používá při porovnání průměrů vzorků v populacích. Je to míra přesnost průměrné hodnoty vzorku. Vzorový průměr je statistika odvozená z dat, která mají podkladové rozdělení. Nemůžeme to vizualizovat stejným způsobem jako data, protože jsme provedli jeden experiment a máme pouze jednu hodnotu. Statistická teorie nám říká, že průměr vzorku (pro velký „dost“ vzorek a za několika podmínek pravidelnosti) je přibližně normálně distribuován. Standardní odchylku této normální distribuce nazýváme standardní chybou.
Obrázek 2. Distribuce ve spodní části se opakujerozesílá distribuci dat, zatímco distribuce nahoře je teoretická distribuce průměru vzorku. SD 20 je míra šíření dat, zatímco SE 5 je míra nejistoty kolem průměru vzorku.
Když chceme porovnat průměry výsledků ze dvou vzorků experimentu Léčba A vs. Léčba B, pak musíme odhadnout, jak přesně jsme změřili prostředky.
Vlastně nás zajímá, jak přesně jsme změřili rozdíl mezi těmito dvěma prostředky. Toto opatření nazýváme standardní chybou rozdílu. Nebudete překvapeni, když zjistíte, že standardní chyba rozdílu ve vzorcích znamená funkci standardních chyb prostředků:
Nyní, když jste pochopili, že standardní chyba průměru (SE) a směrodatná odchylka distribuce (SD) jsou dvě různá zvířata, možná vás zajímá, jak byli zmateni. I když se koncepčně liší, mají jednoduchý vztah matematicky:
,kde n je počet datových bodů.
Všimněte si, že standardní chyba závisí na dvou složkách: standardní odchylce vzorku a velikosti vzorku n. To dává intuitivní smysl: čím větší je standardní odchylka vzorku, tím méně přesný můžeme odhadnout skutečný průměr.
Čím větší je velikost vzorku, tím více informací máme o populaci a přesněji můžeme odhadnout skutečný průměr.
SE je ukazatelem spolehlivosti průměru. Malá SE je indikací, že průměr vzorku je přesnějším odrazem skutečného průměru populace. Větší velikost vzorku obvykle povede k menší SE (zatímco SD není přímo ovlivněna velikostí vzorku).
Většina průzkumů průzkumu zahrnuje kreslení vzorku z populace. Z výsledků získaných z tohoto vzorku pak učiníme závěry o populaci. Pokud byl nakreslen druhý vzorek, výsledky se pravděpodobně nebudou přesně shodovat s prvním vzorkem. Pokud byla průměrná hodnota pro atribut hodnocení 3,2 pro jeden vzorek, může to být 3,4 pro druhý vzorek stejné velikosti. Kdybychom měli z naší populace čerpat nekonečný počet vzorků (stejné velikosti), mohli bychom pozorované prostředky zobrazit jako distribuci. Pak bychom mohli spočítat průměr všech našich vzorků. Tento průměr by se rovnal skutečné průměrné populaci. Můžeme také vypočítat SD distribuce vzorových prostředků. SD tohoto rozdělení vzorových prostředků je SE každého průměrného vzorku.
Máme tedy naše nejvýznamnější pozorování: SE je SD průměru populace.
Vzorek | Znamenat |
1. | 3.2 |
2. | 3.4 |
3. | 3.3 |
4. | 3.2 |
5 | 3.1 |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
Znamenat | 3.3 |
Std. Dev. | 0,13 |
Tabulka ilustrující vztah mezi SD a SE
Nyní je jasné, že pokud SD této distribuce nám pomůže pochopit, jak daleko je průměr vzorku od skutečné průměrné populace, můžeme to použít k pochopení toho, jak přesný je průměr každého jednotlivého vzorku ve vztahu ke skutečnému průměru. To je podstata SE.
Ve skutečnosti jsme z naší populace čerpali pouze jeden vzorek, ale tento výsledek můžeme použít k odhadu spolehlivosti našeho pozorovaného průměru vzorku.
Ve skutečnosti nám SE říká, že si můžeme být 95% jistí, že náš pozorovaný průměr vzorku je plus nebo mínus zhruba 2 (ve skutečnosti 1,96) standardní chyby z průměrného počtu obyvatel.
Níže uvedená tabulka ukazuje rozdělení odpovědí z našeho prvního (a pouze) vzorku použitého pro náš výzkum. SE 0,13, protože je relativně malý, naznačuje, že náš průměr je relativně blízký skutečnému průměru naší celkové populace. Rozpětí chyb (při 95% spolehlivosti) pro náš průměr je (zhruba) dvojnásobek této hodnoty (+/- 0,26), což nám říká, že skutečný průměr je s největší pravděpodobností mezi 2,94 a 3,46.
Odpůrce | Hodnocení |
A | 3 |
B | 3 |
C | 3 |
D | 3 |
E | 4 |
F | 4 |
G | 3 |
H | 3 |
Já | 3 |
J | 3 |
Znamenat | 3.2 |
Std. Chybovat | 0,13 |
souhrn
Mnoho vědců nerozumí rozdílu mezi standardní odchylkou a standardní chybou, přestože jsou běžně zahrnuti do analýzy dat. I když skutečné výpočty pro standardní odchylku a standardní chybu vypadají velmi podobně, představují dvě velmi odlišná, ale doplňková opatření. SD nám říká o tvaru naší distribuce, o tom, jak blízko jsou jednotlivé hodnoty dat od střední hodnoty. SE nám říká, jak blízko je náš průměr vzorku skutečnému průměru celé populace. Společně pomáhají poskytnout ucelenější obrázek, než nám může říct sám průměr.