Studenti, kteří se pustili do strojového učení, se setkali s obtížemi při rozlišování učení pod dohledem od učení bez dozoru. Zdá se, že postup používaný v obou metodách učení je stejný, což ztěžuje rozlišení mezi dvěma metodami učení. Po prozkoumání a neochvějné pozornosti však lze jasně pochopit, že mezi učením pod dohledem a bez dozoru existují značné rozdíly..
Dozorované učení je jednou z metod spojených se strojovým učením, která zahrnuje alokaci označených dat tak, aby z nich mohla být odvozena určitá struktura nebo funkce. Stojí za povšimnutí, že supervidované učení zahrnuje přidělení vstupního objektu, vektoru, a současně předvídání nejžádanější výstupní hodnoty, která je většinou označována jako supervizní signál. Vlastnost spodního řádku učení pod dohledem je, že vstupní data jsou dobře známa a označena.
Neupozorované učení je druhá metoda algoritmu strojového učení, kde jsou závěry čerpány z neznačených vstupních dat. Cílem učení bez dozoru je zjistit skryté vzorce nebo seskupení dat z neznačených dat. Většinou se používá při průzkumné analýze dat. Jedním z definujících znaků učení bez dozoru je, že vstup i výstup nejsou známy.
Primární rozdíl mezi učením pod dohledem a učením bez dozoru jsou data použitá v obou metodách strojového učení. Stojí za zmínku, že obě metody strojového učení vyžadují data, která budou analyzovat, aby vytvořily určité funkce nebo datové skupiny. Vstupní data použitá při učení pod dohledem jsou však dobře známa a jsou označena. To znamená, že stroj je pověřen pouze úlohou určovat skryté vzory z již označených dat. Data použitá v učení bez dozoru však nejsou známa ani označena. Je to práce stroje kategorizovat a označit nezpracovaná data před určením skrytých vzorů a funkcí vstupních dat.
Strojové učení je složitá záležitost a každá zúčastněná osoba musí být připravena na budoucí úkol. Jedním z výrazných rozdílů mezi učením pod dohledem a učením bez dozoru je výpočetní složitost. Dozorované učení je považováno za složitou metodu učení, zatímco metoda učení bez dozoru je méně složitá. Jedním z důvodů, proč je učená záležitost pod dohledem, je skutečnost, že člověk musí porozumět a označit vstupy, zatímco v učení bez dozoru není nutné porozumět a označit vstupy. To vysvětluje, proč mnoho lidí upřednostňuje učení bez dozoru ve srovnání s metodou strojového učení pod dohledem.
Další převládající rozdíl mezi učením pod dohledem a učením bez dozoru je přesnost výsledků získaných po každém cyklu strojové analýzy. Všechny výsledky generované supervizovanou metodou strojového učení jsou přesnější a spolehlivější ve srovnání s výsledky generovanými metodou strojového učení bez dozoru. Jedním z faktorů, který vysvětluje, proč vedená metoda strojového učení poskytuje přesné a spolehlivé výsledky, je skutečnost, že vstupní data jsou dobře známa a označena, což znamená, že stroj bude analyzovat pouze skryté vzorce. Toto je na rozdíl od nepodřízené metody učení, kde stroj musí definovat a označit vstupní data před určením skrytých vzorů a funkcí.
Rovněž stojí za zmínku, že existuje významný rozdíl, pokud jde o počet tříd. Stojí za povšimnutí, že jsou známy všechny třídy používané v učení pod dohledem, což znamená, že budou pravděpodobně známy i odpovědi v analýze. Jediným cílem supervidovaného učení je proto určit neznámý klastr. Neexistují však žádné předchozí znalosti o metodě strojového učení bez dozoru. Kromě toho není znám počet tříd, což jasně znamená, že nejsou známy žádné informace a výsledky generované po analýze nelze zjistit. Navíc lidé, kteří se podílejí na metodě učení bez dozoru, si nejsou vědomi žádných informací týkajících se prvotních dat a očekávaných výsledků.
Mezi jinými rozdíly existuje čas, po kterém každá metoda učení probíhá. Je důležité zdůraznit, že kontrolovaná metoda učení probíhá off-line, zatímco nekontrolovaná metoda učení probíhá v reálném čase. Lidé podílející se na přípravě a označování vstupních údajů tak dělají off-line, zatímco analýza skrytého vzoru se provádí online, což popírá lidem zapojeným do strojového učení možnost interakce se strojem, protože analyzuje diskrétní data. Neupozorovaná metoda strojového učení však probíhá v reálném čase tak, že všechna vstupní data jsou analyzována a označována v přítomnosti studentů, což jim pomáhá pochopit různé metody učení a klasifikace prvotních dat. Analýza dat v reálném čase zůstává nejvýznamnějším přínosem metody učení bez dozoru.
Dozorované učení | Bez dozoru | |
Vstupní data | Používá známá a označená vstupní data | Používá neznámá vstupní data |
Výpočetní složitost | Velmi složitý výpočet | Méně výpočetní složitost |
Reálný čas | Používá off-line analýzu | Používá analýzu dat v reálném čase |
Počet tříd | Počet tříd je znám | Počet tříd není znám |
Přesnost výsledků | Přesné a spolehlivé výsledky | Mírné přesné a spolehlivé výsledky |