Rozdíl mezi klasifikací a regresí

klíčový rozdíl mezi klasifikací a regresním stromem je to v klasifikaci jsou závislé proměnné kategorické a neuspořádané, zatímco v regresi jsou závislé proměnné spojité nebo uspořádané celé hodnoty.

Klasifikace a regrese jsou techniky učení k vytvoření modelů predikce ze shromážděných dat. Obě techniky jsou graficky prezentovány jako klasifikační a regresní stromy, nebo spíše vývojové diagramy s dělením dat po každém kroku, nebo spíše jako „větev“ ve stromu. Tento proces se nazývá rekurzivní rozdělení. Pole, jako je těžba, používají tyto techniky klasifikace a regrese. Tento článek se zaměřuje na strom klasifikace a regresní strom.

OBSAH

1. Přehled a klíčový rozdíl
2. Co je klasifikace
3. Co je to regrese
4. Porovnání vedle sebe - klasifikace vs. regrese v tabulkové formě
5. Shrnutí

Co je klasifikace?

Klasifikace je technika používaná k dosažení schématu, které ukazuje organizaci dat počínaje prekurzorovou proměnnou. Závislé proměnné jsou to, co klasifikuje data.

Obrázek 01: Těžba dat

Klasifikační strom začíná nezávislou proměnnou, která se rozdělí do dvou skupin podle určování existujících závislých proměnných. Účelem je objasnit odpovědi ve formě kategorizace vyvolané závislými proměnnými.

Co je to regrese

Regrese je predikční metoda, která je založena na předpokládané nebo známé číselné výstupní hodnotě. Tato výstupní hodnota je výsledkem řady rekurzivního rozdělení, přičemž každý krok má jednu číselnou hodnotu a další skupinu závislých proměnných, které se rozvětvují do jiné dvojice, jako je tato.

Regresní strom začíná jednou nebo více prekurzorovými proměnnými a končí jednou konečnou výstupní proměnnou. Závislé proměnné jsou buď spojité nebo diskrétní číselné proměnné.

Jaký je rozdíl mezi klasifikací a regresí??

 Klasifikace vs regrese

Stromový model, kde cílová proměnná může mít diskrétní sadu hodnot. Stromový model, kde cílová proměnná může mít spojité hodnoty, obvykle reálná čísla.
Závislá proměnná
Pro klasifikační strom jsou závislé proměnné kategorické. U stromu regrese jsou závislé proměnné číselné.
Hodnoty
Má stanovené množství neuspořádaných hodnot. Má buď diskrétní, ale uspořádané hodnoty, nebo indiskrétní hodnoty.
Účel stavby
Účelem konstrukce regresního stromu je přizpůsobit regresní systém každé determinantní větvi tak, aby se objevila očekávaná výstupní hodnota.. Klasifikační strom se rozvětví, jak je určeno závislou proměnnou odvozenou z předchozího uzlu.

Shrnutí - klasifikace vs. regrese

Regresní a klasifikační stromy jsou užitečné techniky pro mapování procesu, který ukazuje na studovaný výsledek, ať už v klasifikaci nebo na jediné číselné hodnotě. Rozdíl mezi klasifikačním stromem a regresním stromem je závislá proměnná. Klasifikační stromy mají závislé proměnné, které jsou kategorické a neuspořádané. Regresní stromy mají závislé proměnné, které jsou spojité nebo uspořádané celé hodnoty.

Odkaz:

1. „Learning Tree Learning.“ Wikipedia, Wikimedia Foundation, 13. května 2018. K dispozici zde 

Obrázek se svolením:

1.'Data Mining'By Arbeck - vlastní práce, (CC BY 3.0) přes Commons Wikimedia