Lineární vs. logická regrese
Ve statistické analýze je důležité identifikovat vztahy mezi proměnnými, kterých se studie týká. Někdy to může být jediným účelem samotné analýzy. Jedním silným nástrojem používaným ke zjištění existence vztahu a k identifikaci vztahu je regresní analýza.
Nejjednodušší formou regresní analýzy je lineární regrese, kde vztah mezi proměnnými je lineární vztah. Ve statistickém vyjádření přináší vztah mezi vysvětlující proměnnou a proměnnou odezvy. Například pomocí regrese můžeme stanovit vztah mezi cenou komodity a spotřebou na základě údajů shromážděných z náhodného vzorku. Regresní analýza vytvoří regresní funkci sady dat, což je matematický model, který nejlépe odpovídá dostupným datům. To lze snadno reprezentovat rozptylovým grafem. Grafická regrese je ekvivalentní nalezení nejlepší křivky pro daný datový soubor. Funkce křivky je regresní funkce. Pomocí matematického modelu lze předvídat použití komodity za danou cenu.
Regresní analýza se proto široce používá při předpovídání a předpovídání. Používá se také k navázání vztahů v experimentálních datech, v oborech fyzika, chemie a v mnoha přírodních a technických oborech. Pokud je vztah nebo regresní funkce lineární funkcí, pak je tento proces známý jako lineární regrese. V rozptylovém grafu může být reprezentován jako přímka. Pokud funkce není lineární kombinací parametrů, je regrese nelineární.
Logistická regrese je srovnatelná s multivariační regresí a vytváří model vysvětlující dopad více prediktorů na proměnnou odezvy. V logistické regresi by však měla být konečná výsledková proměnná kategorická (obvykle rozdělena; tj. Pár dosažitelných výsledků, jako je smrt nebo přežití, i když speciální techniky umožňují modelovat podrobnější informace). Proměnná nepřetržitého výsledku může být transformována do kategorické proměnné, která bude použita pro logistickou regresi; kolapsu spojitých proměnných tímto způsobem se však většinou nedoporučuje, protože to snižuje přesnost.
Na rozdíl od lineární regrese nemusí být prediktorové proměnné v logistické regresi nuceny, aby byly lineárně propojeny, běžně distribuovány nebo aby měly stejnou odchylku uvnitř každého klastru. Výsledkem je, že vztah mezi prediktorem a výslednými proměnnými pravděpodobně nebude lineární funkcí.
Jaký je rozdíl mezi logistickou a lineární regresí??
• V lineární regresi se předpokládá lineární vztah mezi vysvětlující proměnnou a proměnnou odezvy a parametry vyhovující modelu se nacházejí analýzou, aby se získal přesný vztah.
• Lineární regrese se provádí pro kvantitativní proměnné a výsledná funkce je kvantitativní.
• V logistické regresi mohou být použitá data buď kategorická, nebo kvantitativní, ale výsledek je vždy kategorický.