Sociální vědci často vytvářejí hypotézu, v níž předpokládají, že určité obecné pravidlo lze aplikovat na populaci. Tuto hypotézu testují pomocí testů, které mohou být parametrické nebo neparametrické. Parametrické testy jsou obvykle běžnější a jsou studovány mnohem dříve jako standardní testy používané při provádění výzkumu.
Proces výzkumu je relativně jednoduchý - konstruujete hypotézu a předpokládáte, že na populaci lze aplikovat určitý „zákon“. Poté provedete test a shromáždíte data, která pak statisticky analyzujete. Shromážděná data lze obvykle reprezentovat jako graf a hypotetický zákon jako střední hodnota těchto dat. Pokud se hypotetizovaný zákon a zákon o střední hodnotě shodují, hypotéza se potvrdí.
V některých případech však není nalezení střední hodnoty nejvhodnějším způsobem hledání zákona. Skvělým příkladem je rozdělení celkového příjmu. Pokud jste neodpovídali střední hodnotě, je to pravděpodobně proto, že jeden nebo dva miliardáři ruší vaše střední hodnoty. Medián však poskytne mnohem přesnější výsledek průměrného příjmu, který s větší pravděpodobností odpovídá vašim údajům.
Jinými slovy, parametrický test se použije, pokud jsou předpoklady o populaci jasné a existuje o nich mnoho dostupných informací. Otázky budou navrženy tak, aby měřily tyto specifické parametry tak, aby mohla být data analyzována, jak je popsáno výše. Neparametrický test se používá, pokud testovaná populace není zcela známa, a proto ani zkoumané parametry nejsou známy. Kromě toho, zatímco parametrický test používá jako své výsledky střední hodnoty, neparametrický test bere medián, a proto se obvykle používá, když původní hypotéza neodpovídá datům.
Parametrický test je test navržený tak, aby poskytoval data, která budou poté analyzována prostřednictvím vědeckého odvětví zvaného parametrická statistika. Parametrická statistika předpokládá, že některé informace o populaci jsou již známy, konkrétně rozdělení pravděpodobnosti. Jako příklad lze uvést rozdělení tělesné výšky na celý svět pomocí normálního distribučního modelu. Podobně jako jakýkoli známý distribuční model lze použít na soubor dat. Předpokládáme-li však, že určitý distribuční model se hodí do souboru dat, znamená to, že jste předpokládal, že o populaci jsou známy některé další informace, jak jsem již zmínil. Pravděpodobnostní rozdělení obsahuje různé parametry, které popisují přesný tvar rozdělení. Tyto parametry jsou to, co poskytují parametrické testy - každá otázka je přizpůsobena tak, aby poskytla přesnou hodnotu určitého parametru pro každého dotazovaného jednotlivce. Souhrnně se střední hodnota tohoto parametru použije pro rozdělení pravděpodobnosti. To znamená, že parametrické testy také předpokládají něco o populaci. Pokud jsou předpoklady správné, parametrické statistiky aplikované na data poskytnutá parametrickým testem poskytnou výsledky, které jsou mnohem přesnější a přesnější než výsledky neparametrického testu a statistiky..
Podobně jako parametrický test a statistika existuje neparametrický test a statistika. Používají se, když se neočekává, že získaná data budou odpovídat normální distribuční křivce nebo ordinálním datům. Skvělým příkladem ordinálních dat je recenze, kterou necháte, když hodnotíte určitý produkt nebo službu na stupnici od 1 do 5. Ordinální data obecně se získají z testů, které používají různé hodnocení nebo objednávky. Proto se nespoléhá na čísla nebo přesné hodnoty parametrů, na které se spoléhaly parametrické testy. Ve skutečnosti parametry nijak nevyužívá, protože nepředpokládá určitou distribuci. Obvykle je parametrická analýza preferována před neparametrickou analýzou, ale pokud parametrický test nelze provést kvůli neznámé populaci, je nutné uchýlit se k neparametrickým testům..
Jak jsem již zmínil, parametrický test vytváří předpoklady o populaci. Potřebuje parametry, které jsou spojeny s normální distribucí, která se používá v analýze, a jediný způsob, jak tyto parametry znát, je mít nějaké znalosti o populaci. Na druhé straně, neparametrický test, jak název napovídá, nespoléhá na žádné parametry, a proto nepředpokládá nic o populaci.
Základem statistické analýzy, která bude provedena na datech, je v případě parametrických testů pravděpodobnostní rozdělení. Na druhé straně neexistuje základ pro neparametrické testy - je to zcela svévolné. To má za následek větší flexibilitu a usnadňuje přizpůsobení hypotézy shromážděným datům.
Míra centrální tendence je centrální hodnotou v rozdělení pravděpodobnosti. A ačkoli rozdělení pravděpodobnosti v případě neparametrických statistik je svévolné, stále existuje, a proto také míra centrální tendence. Tato opatření se však liší. V případě parametrických testů se považuje za průměrnou hodnotu, zatímco v případě neparametrických testů se považuje za střední hodnotu.
Jak jsem zmínil v prvním rozdílu, informace o populaci se liší mezi parametrickými a neparametrickými testy a statistikami. Konkrétně určité znalosti o populaci jsou naprosto nezbytné pro parametrickou analýzu, protože k dosažení přesných výsledků vyžadují parametry související s populací. Na druhou stranu lze použít neparametrický přístup bez předchozí znalosti populace.