Variance vs Covariance
Variance a kovariance jsou dvě měřítka používaná ve statistice. Varianta je měřítkem rozptylu dat a kovariance označuje stupeň změny dvou náhodných proměnných dohromady. Varianta je spíše intuitivní pojem, ale kovariance je definována matematicky v ne tak intuitivním zpočátku.
Více o variantě
Varianta je míra rozptylu dat od střední hodnoty distribuce. Říká, jak daleko leží datové body od průměru distribuce. Je to jeden z primárních deskriptorů rozdělení pravděpodobnosti a jeden z okamžiků rozdělení. Rozptyl je také parametr populace a rozptyl vzorku z populace působí jako odhadce rozptylu populace. Z jednoho pohledu je definován jako čtverec standardní odchylky.
V obyčejném jazyce, to může být popisováno jako průměr čtverců vzdálenosti mezi každým datovým bodem a průměrem distribuce. Následující vzorec se používá pro výpočet rozptylu.
Var (X) = E [(X-µ)2 ] pro populaci a
Var (X) = E [(X-‾x)2 ] pro vzorek
Může být dále zjednodušeno na Var (X) = E [X2 ] - (E [X])2.
Variance má některé vlastnosti podpisu a často se používá ve statistikách, aby se používání zjednodušilo. Odchylka je nezáporná, protože je čtvercem vzdáleností. Rozsah rozptylu však není omezen a závisí na konkrétní distribuci. Rozptyl konstantní náhodné proměnné je nula a rozptyl se nemění s ohledem na parametr umístění.
Více o Covariance
Ve statistické teorii je kovariance měřítkem toho, jak se dvě náhodně proměnné mění společně. Jinými slovy, kovariance je měřítkem síly korelace mezi dvěma náhodnými proměnnými. Lze jej také považovat za zobecnění pojmu rozptyl dvou náhodných proměnných.
Covariance dvou náhodných proměnných X a Y, které jsou společně distribuovány s konečnou druhou hybností, se nazývá σXY= E [(X-E [X]) (Y-E [Y])]. Od tohoto, rozptyl může být viděn jako zvláštní případ kovariance, kde dvě proměnné jsou stejné. Cov (X, X) = Var (X)
Normalizací kovariance lze získat lineární korelační koeficient nebo Pearsonův korelační koeficient, který je definován jako ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graficky lze kovarianci mezi párem datových bodů vidět jako oblast obdélníku s datovými body v opačných vrcholech. Může být interpretován jako míra velikosti oddělení mezi dvěma datovými body. S ohledem na obdélníky pro celou populaci lze překrývání obdélníků odpovídajících všem datovým bodům považovat za sílu oddělení; rozptyl těchto dvou proměnných. Covariance je ve dvou dimenzích, protože dvou proměnných, ale zjednodušení na jednu proměnnou dává rozptyl jedné, protože oddělení v jedné dimenzi.
Jaký je rozdíl mezi Variance a Covariance?
• Varianta je míra rozptylu / rozptylu v populaci, zatímco kovariance je považována za míru variace dvou náhodných proměnných nebo síly korelace..
• Variantu lze považovat za zvláštní případ kovariance.
• Variace a kovariance závisí na velikosti datových hodnot a nelze je srovnávat; proto jsou normalizovány. Koovariance je normalizována na korelační koeficient (dělení součinem směrodatných odchylek dvou náhodných proměnných) a rozptyl je normalizován na směrodatnou odchylku (pomocí druhé odmocniny)