Korelace i regrese jsou statistické nástroje, které se zabývají dvěma nebo více proměnnými. Ačkoli se oba týkají stejného předmětu, existují mezi nimi rozdíly. Rozdíly mezi nimi jsou vysvětleny níže.
Termín korelace s odkazem na dvě nebo více proměnných znamená, že proměnné jsou nějakým způsobem spřízněny. Korelační analýza určuje, zda existuje vztah mezi dvěma proměnnými a sílu vztahu. Jsou-li dvě proměnné x (nezávislé) a y (závislé) tak příbuzné, že je doprovázena změna velikosti nezávislé proměnné, změnou velikosti závislé proměnné se říká, že obě proměnné jsou korelovány..
Korelace může být lineární nebo nelineární. Lineární korelace je taková, kde proměnné jsou tak příbuzné, že změna hodnoty jedné proměnné by způsobila důslednou změnu hodnoty jiné proměnné. V lineární korelaci by se rozptýlené body vztahující se k příslušným hodnotám závislých a nezávislých proměnných seskupovaly kolem nehorizontální přímky, i když vodorovná přímka by také naznačovala lineární vztah mezi proměnnými, pokud by přímka mohla spojovat body představující proměnné.
Na druhé straně regresní analýza používá existující data k určení matematického vztahu mezi proměnnými, které lze použít ke stanovení hodnoty závislé proměnné s ohledem na jakoukoli hodnotu nezávislé proměnné..
Korelace se týká měření síly asociace nebo intenzity vztahu, kde jako regrese se jedná o predikci hodnoty závislé proměnné ve vztahu ke známé hodnotě nezávislé proměnné. To lze vysvětlit pomocí následujících vzorců.
Korelační koeficient nebo korelační koeficient (r) mezi x & y se zjistí pomocí následujícího vzorce;
r = kovariance (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy jsou standardní odchylky xay, a, - - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Korelační koeficient r je čisté číslo a je nezávislý na měrné jednotce. Pokud tedy x je výška (palce) a y je hmotnost (liber) lidí určité oblasti, pak r není ani v palcích, ani v librách, ale jednoduše číslo.
Regresní rovnice se zjistí pomocí následujícího vzorce;
Regresní rovnice y na x (pro zjištění odhadu y) je y - y '= byx (x-x‾), byx se nazývá regresní koeficient y na x. Regresní rovnice x na y (pro zjištění odhadu x) je x - x '= bxy (y-y‾), bxy se nazývá regresní koeficient x na y.
Korelační analýza nepředpokládá závislost žádné proměnné na jiné proměnné, ani se nepokouší zjistit vztah mezi nimi. Jednoduše odhaduje stupeň asociace mezi proměnnými. Jinými slovy, korelační analýza testuje vzájemnou závislost proměnných. Regresní analýza na druhé straně popisuje závislost závislé proměnné nebo proměnné odezvy na nezávislé nebo vysvětlující proměnné / s. Regresní analýza předpokládá existenci jednosměrného kauzálního vztahu mezi vysvětlujícími a proměnnými odezvy a nezohledňuje, zda je tento kauzální vztah pozitivní nebo negativní. Pro korelaci jsou hodnoty závislých i nezávislých proměnných náhodné, ale pro regresní hodnoty nezávislých proměnných nemusí být náhodné.
1. Korelační analýza je test vzájemné závislosti mezi dvěma proměnnými. Regresní analýza poskytuje matematický vzorec pro stanovení hodnoty závislé proměnné s ohledem na hodnotu nezávislé proměnné / s.
2. Korelační koeficient je nezávislý na výběru původu a měřítka, ale regresní koeficient tomu tak není.
Pro korelaci musí být hodnoty obou proměnných náhodné, ale pro regresní koeficient to neplatí.
1. Das, N. G., (1998), Statistical Methods, Calcutta
2. Korelace a regrese, k dispozici na www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regrese a korelace, k dispozici na www.abyss.uoregon.edu