Klasifikace a predikace jsou dva termíny spojené s dolováním dat. Data jsou důležitá pro téměř všechny organizace, aby zvýšila zisk a porozuměla trhu. Obyčejná data nemají velkou hodnotu. Data by proto měla být zpracována, aby se získaly užitečné informace. Dolování dat je technologie, která získává informace z velkého množství dat. Pomáhá získat široké porozumění datům. Některé aplikace dolování dat jsou analýza trhu, kontrola výroby a detekce podvodů. Klasifikace a predikace jsou dva termíny spojené s dolováním dat. Tento článek popisuje rozdíl mezi klasifikací a predikcí. Klasifikace je proces identifikace kategorie nebo označení třídy nového pozorování, ke kterému patří. Predikace je proces identifikace chybějících nebo nedostupných číselných údajů pro nové pozorování. Toto je klíčový rozdíl mezi klasifikace a predikce. Predikce se netýká označení třídy jako v klasifikaci.
1. Přehled a klíčový rozdíl
2. Co je klasifikace
3. Co je předpověď
4. Podobnosti mezi klasifikací a predikcí
5. Porovnání vedle sebe - klasifikace vs predikce v tabulkové formě
6. Shrnutí
Klasifikace je identifikace kategorie nebo označení třídy nového pozorování. Nejprve se jako tréninková data použije sada dat. Algoritmu je dána sada vstupních dat a odpovídající výstupy. Sada tréninkových dat tedy zahrnuje vstupní data a související štítky tříd. Použitím datového souboru školení odvodí algoritmus model nebo klasifikátor. Odvozený model může být strom rozhodování, matematický vzorec nebo neuronová síť. V klasifikaci, když jsou modelu poskytnuta neoznačená data, měla by najít třídu, do které patří. Nová data poskytnutá modelu jsou sada testovacích dat.
Klasifikace je proces klasifikace záznamu. Jedním jednoduchým příkladem klasifikace je ověření, zda prší nebo ne. Odpověď může být buď ano, nebo ne. Existuje tedy určitý počet možností. Někdy lze klasifikovat více než dvě třídy. To je nazýváno klasifikace více tříd. Ve skutečnosti musí banka analyzovat, zda je poskytnutí úvěru konkrétnímu zákazníkovi riskantní nebo ne. V tomto příkladu je model konstruován tak, aby nalezl kategorický štítek. Štítky jsou riskantní nebo bezpečné.
Dalším procesem analýzy dat je predikace. Používá se k nalezení numerického výstupu. Stejně jako v klasifikaci obsahuje datový soubor školení vstupy a odpovídající číselné výstupní hodnoty. Podle školicího datového souboru algoritmus odvozuje model nebo prediktor. Po zadání nových dat by měl model najít číselný výstup. Na rozdíl od klasifikace tato metoda nemá označení třídy. Model předpovídá spojitou funkci nebo objednanou hodnotu.
Regrese se obvykle používá pro predikaci. Příkladem predikce je predikce hodnoty domu v závislosti na skutečnostech, jako je počet pokojů, celková plocha atd. Společnost může najít množství peněz, které zákazník utratil během prodeje. To je také příklad pro předpověď.
Klasifikace vs Predikace | |
Klasifikace je proces identifikace, do které kategorie patří nové pozorování, na základě souboru údajů o školení obsahujících pozorování, jejichž členství v kategorii je známo. | Predikace je proces identifikace chybějících nebo nedostupných číselných údajů pro nové pozorování. |
Přesnost | |
Při klasifikaci přesnost závisí na správném nalezení označení třídy. | V predikci závisí přesnost na tom, jak dobře daný predikátor může uhodnout hodnotu predikovaného atributu pro nová data.. |
Modelka | |
Model nebo klasifikátor je konstruován tak, aby nalezl kategorické štítky. | Bude vytvořen model nebo prediktor, který předpovídá funkci nebo hodnotu s průběžnou hodnotou. |
Synonyma pro model | |
V klasifikaci může být model znám jako klasifikátor. | V predikci může být model známý jako prediktor. |
Extrakce smysluplných informací z obrovské sady dat se nazývá těžba dat. Tento článek popisuje dvě metody analýzy dat v dolování dat, jako je klasifikace a predikace. Rychlost, škálovatelnost a robustnost jsou značné faktory v klasifikačních a predikčních metodách. Klasifikace je proces identifikace kategorie nebo označení třídy nového pozorování, ke kterému patří. Predikace je proces identifikace chybějících nebo nedostupných číselných údajů pro nové pozorování. To je rozdíl mezi klasifikací a predikcí.
1.Point, Návody. „Klasifikace a predikce dolování dat.“, Tutoriály, 8. ledna 2018. K dispozici zde
2. „Statistická klasifikace.“ Wikipedia, Wikimedia Foundation, 6. března 2018. K dispozici zde
1.'2729773 'od GDJ (Public Domain) prostřednictvím pixabay