Dozorované učení a učení bez dozoru jsou dva základní pojmy strojového učení. Dohledované učení je úkolem strojového učení se naučit funkci, která mapuje vstup na výstup na základě příkladů vstup-výstup. Unsupervised Learning je úkolem strojového učení odvodit funkci popisující skrytou strukturu z neznačených dat. klíčový rozdíl mezi kontrolovaným a nedohlednutým strojovým učením je to supervize učení používá označená data, zatímco učení bez dozoru používá neoznačená data.
Strojové učení je pole v informatice, které umožňuje počítačovému systému učit se z dat, aniž by bylo explicitně programováno. Umožňuje analyzovat data a předpovídat v nich vzory. Existuje mnoho aplikací strojového učení. Některé z nich jsou rozpoznávání obličeje, rozpoznávání gest a rozpoznávání řeči. Existuje několik algoritmů souvisejících se strojovým učením. Některé z nich jsou regrese, klasifikace a shlukování. Nejběžnější programovací jazyky pro vývoj aplikací založených na strojovém učení jsou R a Python. Lze použít i jiné jazyky, jako je Java, C ++ a Matlab.
1. Přehled a klíčový rozdíl
2. Co je učení pod dohledem
3. Co je učení bez dozoru
4. Podobnosti mezi strojovým učením pod dohledem a bez dozoru
5. Srovnání bok po boku - strojové učení pod dohledem a bez dozoru v podobě tabulky
6. Shrnutí
V systémech založených na strojovém učení pracuje model podle algoritmu. V učení pod dohledem je model pod dohledem. Nejprve je nutné model trénovat. Se získanými znalostmi může předpovídat odpovědi pro budoucí případy. Model je vyškolen pomocí označeného datového souboru. Pokud je systému poskytnuta data mimo vzorek, může předpovídat výsledek. Následuje malý výpis z populárního datového souboru IRIS.
Podle výše uvedené tabulky se nazývají atributy samostatná délka, samostatná šířka, délka patelu, šířka patelu a druh. Sloupce jsou známé jako funkce. Jeden řádek obsahuje data pro všechny atributy. Jeden řádek se proto nazývá pozorování. Data mohou být číselná nebo kategorická. Model má jako vstup pozorování s odpovídajícím názvem druhu. Když je dáno nové pozorování, model by měl předpovídat typ druhu, ke kterému patří.
Ve vzdělávání pod dohledem existují algoritmy pro klasifikaci a regresi. Klasifikace je proces klasifikace označených dat. Model vytvořil hranice oddělující kategorie dat. Když jsou modelu poskytnuta nová data, lze je roztřídit podle toho, kde bod existuje. K-Nearest Neighbors (KNN) je klasifikační model. V závislosti na hodnotě k se rozhodne o kategorii. Například, když k je 5, je-li konkrétní datový bod blízko osmi datových bodů v kategorii A a šesti datových bodů v kategorii B, bude datový bod klasifikován jako A.
Regrese je proces předpovídání trendu předchozích dat, který předpovídá výsledek nových dat. V regresi může výstup sestávat z jedné nebo více spojitých proměnných. Predikce se provádí pomocí řádku, který pokrývá většinu datových bodů. Nejjednodušší regresní model je lineární regrese. Je rychlý a nevyžaduje parametry ladění, jako například v KNN. Pokud data ukazují parabolický trend, pak lineární regresní model není vhodný.
To jsou některé příklady dohlížecích algoritmů učení. Obecně jsou výsledky generované metodami učení pod dohledem přesnější a spolehlivější, protože vstupní data jsou dobře známa a označena. Proto musí stroj analyzovat pouze skryté vzory.
V učení bez dozoru není model pod dohledem. Model pracuje sám o sobě, předpovídat výsledky. Využívá algoritmy strojového učení k závěru o neoznačených datech. Obecně jsou nepodřízené učební algoritmy těžší než podřízené učební algoritmy, protože existuje jen málo informací. Clustering je druh učení bez dozoru. Může být použit k seskupení neznámých dat pomocí algoritmů. Klastrování k-střední a hustoty založené na klastrech jsou dva klastrové algoritmy.
k-střední algoritmus, umístí k centroid náhodně pro každý cluster. Pak je každému datovému bodu přiřazena nejbližší těžiště. Euklidovská vzdálenost se používá k výpočtu vzdálenosti od datového bodu k těžiště. Datové body jsou rozděleny do skupin. Pozice pro centroidy se znovu vypočítají. Nová poloha těžiště je určena průměrem ze všech bodů ve skupině. Každému datovému bodu je opět přiřazena nejbližší těžiště. Tento proces se opakuje, dokud se těžiště již nezmění. k-střední je rychlý klastrovací algoritmus, ale není specifikována inicializace klastrových bodů. Existuje také velká variabilita klastrovacích modelů na základě inicializace klastrových bodů.
Další klastrovací algoritmus je Shlukování založené na hustotě. To je také známé jako aplikace hustoty založené na prostorovém klastru s hlukem. Funguje tak, že definuje klastr jako maximální sadu připojených bodů hustoty. Jsou to dva parametry používané pro klastrování založené na hustotě. Jsou to Ɛ (epsilon) a minimální počet bodů. Ɛ je maximální poloměr okolí. Minimální počet bodů je minimální počet bodů v sousedství to, které definují klastr. Toto je několik příkladů shlukování, které spadají do učení bez dozoru.
Obecně platí, že výsledky generované z nepodporovaných algoritmů učení nejsou příliš přesné a spolehlivé, protože stroj musí před určením skrytých vzorců a funkcí definovat a označit vstupní data..
Dohlíží na strojové učení bez dozoru | |
Dozorované učení je úkolem strojového učení naučit se funkci, která mapuje vstup na výstup na základě příkladů vstup-výstup. | Unsupervised Learning je úkolem strojového učení odvodit funkci popisující skrytou strukturu z neznačených dat. |
Hlavní funkce | |
V učení pod dohledem model předpovídá výsledek na základě označených vstupních dat. | V učení bez dozoru model předpovídá výsledek bez označených dat tím, že identifikuje vzorce sám. |
Přesnost výsledků | |
Výsledky generované metodami učení pod dohledem jsou přesnější a spolehlivější. | Výsledky generované metodami učení bez dozoru nejsou příliš přesné a spolehlivé. |
Hlavní algoritmy | |
Existují algoritmy pro regresi a klasifikaci ve supervizovaném učení. | Existují algoritmy pro shlukování v učení bez dozoru. |
Dozorované učení a učení bez dozoru jsou dva typy strojového učení. Dozorované učení je úkolem strojového učení naučit se funkci, která mapuje vstup na výstup na základě příkladů vstup-výstup. Unsupervised Learning je úkolem strojového učení odvodit funkci popisující skrytou strukturu z neznačených dat. Rozdíl mezi strojovým učením pod dohledem a bez dozoru spočívá v tom, že učené učení používá označená data, zatímco nepodléhající naklánění používá neznačená data..
1.BigDataUniversity. Strojové učení - pod dohledem VS bez dozoru, kognitivní třída, 13. března 2017. K dispozici zde
2. „Neupozorněné učení.“ Wikipedia, Wikimedia Foundation, 20. března 2018. K dispozici zde
3. „Dozorované učení“. Wikipedia, Wikimedia Foundation, 15. března 2018. K dispozici zde
1.'2729781 'od GDJ (Public Domain) prostřednictvím pixabay