Rozdíl mezi T-TEST a ANOVA

T-TEST vs. ANOVA

Shromažďování a výpočet statistických údajů k získání průměru je často zdlouhavý a únavný proces. T-test a jednosměrná analýza rozptylu (ANOVA) jsou dva nejběžnější testy používané pro tento účel.

T-test je statistický test hypotéz, kde statistika testu následuje Studentovu distribuci t, pokud je podporována nulová hypotéza. Tento test se použije, když statistika testu následuje normální rozdělení a je známa hodnota měřítka v testovací statistice. Není-li termín škálování neznámý, je nahrazen odhadem na základě dostupných údajů. Statistiky testu budou sledovat Studentovu t-distribuci.

William Sealy Gosset uvedl t-statistiku v roce 1908. Gosset byl chemik pro pivovar Guinness v irském Dublinu. Guinnessský pivovar měl politiku náboru nejlepších absolventů z Oxfordu a Cambridge, vybírat z těch, kteří by mohli poskytovat aplikace biochemie a statistiky pro zavedené průmyslové procesy společnosti. William Sealy Gosset byl jedním z takových absolventů. William Sealy Gosset při tom navrhl t-test, který byl původně představen jako způsob, jak nákladově efektivně sledovat kvalitu piva (tmavé pivo, které pivovar vyrábí). Gosset zveřejnil test pod názvem „Student“ v Biometrika, circa 1908. Důvodem pro název pera bylo naléhání Guinnessa, protože společnost chtěla dodržovat svou politiku využívání statistik jako součást „obchodního tajemství“..

Statistiky T-testu obecně mají tvar T = Z / s, kde Z a s jsou funkce dat. Proměnná Z je navržena tak, aby byla citlivá na alternativní hypotézu; ve skutečnosti je velikost proměnné Z větší, pokud je alternativní hypotéza pravdivá. Mezitím je 's' parametr škálování, který umožňuje určit distribuci T. Předpoklady t-testu jsou takové, že a) Z následuje standardní normální rozdělení pod nulovou hypotézou; b) ps2 sleduje rozdělení Ï ‡ 2 s p stupni volnosti pod nulovou hypotézou (kde p je pozitivní konstanta); a c) hodnota Z a hodnota S jsou nezávislé. Ve specifickém typu t-testu jsou tyto podmínky důsledky sledované populace, jakož i způsob, jakým jsou údaje vzorkovány..

Na druhé straně analýza rozptylu (ANOVA) je soubor statistických modelů. Zatímco vědci a statistici využívali principy ANOVA po dlouhou dobu, teprve v roce 1918 Sir Ronald Fisher navrhl formalizovat analýzu rozptylu v článku nazvaném „Korelace mezi příbuznými o domněnce Mendelovy dědičnosti“. . Od té doby byla ANOVA rozšířena co do rozsahu a aplikace. ANOVA je vlastně nesprávný název, protože není odvozen od rozdílů rozptylů, ale spíše od rozdílů mezi prostředky skupin. Zahrnuje přidružené postupy, kde je pozorovaná odchylka v konkrétní proměnné rozdělena na komponenty, které lze přiřadit různým zdrojům variace.

ANOVA v podstatě poskytuje statistický test, aby určil, zda jsou prostředky několika skupin všechny stejné, a v důsledku toho zobecňuje t-test na více než dvě skupiny. ANOVA může být užitečnější než dvouvzorkový t-test, protože má menší šanci dopustit se chyby typu I. Například mít vícenásobné dvouvzorkové t-testy by měly větší šanci páchat chybu než ANOVA stejných proměnných, aby se získal průměr. Model je stejný a statistika testu je poměr F. Zjednodušeně řečeno, t-testy jsou pouze zvláštním případem ANOVA: provedení ANOVA bude mít stejný výsledek jako několik t-testů. Existují tři třídy modelů ANOVA: a) Modely s pevnými efekty, které předpokládají, že data pocházejí z běžných populací a liší se pouze svými prostředky; b) Modely náhodných efektů, které předpokládají, že data popisují hierarchii různých populací, jejichž rozdíly jsou omezeny hierarchií; a c) modely se smíšeným efektem, což jsou situace, kdy jsou přítomny jak pevné, tak náhodné účinky.

Souhrn:

  1.  T-test se používá při určování, zda jsou dva průměry nebo průměry stejné nebo různé. ANOVA je výhodná při porovnání tří nebo více průměrů nebo průměrů.
  2.  T-test má větší pravděpodobnost, že se dopustí chyby, čím více prostředků je použito, proto se ANOVA používá při porovnávání dvou nebo více prostředků.