Strojové učení je sada metod používaných k vytváření počítačových programů, které se mohou učit z pozorování a vytvářet předpovědi. Strojové učení používá algoritmy, regrese a související vědy k porozumění datům. Tyto algoritmy lze obecně považovat za statistické modely a sítě.
Hluboké učení je podmnožinou metod strojového učení. Data jsou analyzována prostřednictvím více vrstev hluboké vzdělávací sítě, takže síť může vyvodit závěry a rozhodovat o datech. Hluboké metody učení umožňují velkou přesnost velkých datových sad, ale díky těmto vlastnostem je hluboké učení mnohem náročnější na zdroje než klasické strojové učení..
Po několik desetiletí bylo strojové učení používáno jako metoda dosažení umělé inteligence ve strojích. Ve svém jádru je oblast strojového učení zaměřena na vytváření počítačů, které se mohou učit a rozhodovat, což činí strojové učení vhodným pro výzkum umělé inteligence. Ne všechny modely strojového učení však mají za cíl vyvinout „opravdovou“ umělou inteligenci, která dokonale odpovídá lidské inteligenci nebo ji překračuje. Místo toho jsou modely často navrženy tak, aby zkoumaly specifické, omezené problémy.
Hluboké učení bylo navrženo v raných fázích diskusí o strojovém učení, ale jen málo vědců sledovalo metody hlubokého učení, protože výpočetní požadavky na hluboké učení jsou mnohem větší než v klasickém strojovém učení. Výpočtová síla počítačů se však od roku 2000 exponenciálně zvýšila, což vědcům umožnilo provádět obrovská vylepšení ve strojovém učení a konstrukci umělé inteligence. Protože modely hlubokého učení se dobře rozšiřují se zvýšenými daty, má hluboké učení potenciál překonat významné překážky při vytváření skutečné umělé inteligence.
Strojové učení a hluboké učení jsou algoritmické. V klasickém strojovém učení vědci používají relativně malé množství dat a rozhodují, jaké nejdůležitější vlastnosti jsou v datech, která algoritmus potřebuje, aby mohl předpovídat. Tato metoda se nazývá funkce inženýrství. Například, pokud byl učen program strojového učení, aby rozpoznával obraz letounu, jeho programátoři by vytvořili algoritmy, které umožní programu rozpoznat typické tvary, barvy a velikosti komerčních letadel. Na základě těchto informací by program strojového učení provedl předpovědi, zda jsou obrázky prezentovány se zahrnutými letadly.
Hluboké učení se obecně liší od klasického strojového učení mnoha vrstvami rozhodování. Hluboké vzdělávací sítě jsou často považovány za „černé rámečky“, protože data jsou analyzována prostřednictvím více síťových vrstev, z nichž každá provádí pozorování. To může ztížit pochopení výsledků než výsledků klasického strojového učení. Přesný počet vrstev nebo kroků v rozhodování závisí na typu a složitosti zvoleného modelu.
Strojové učení se tradičně používá malé datové sady, ze kterých se lze učit a vytvářet předpovědi. S malým množstvím dat mohou vědci určit přesné funkce, které pomohou programu strojového učení porozumět a učit se z dat. Pokud se však program dostane do informace, kterou nemůže klasifikovat na základě svých již existujících algoritmů, bude muset vědci obvykle analyzovat problematická data ručně a vytvořit novou funkci. Z tohoto důvodu se klasické strojové učení obvykle s velkými množstvími dat obyčejně nesetkává, ale může minimalizovat chyby na menších sadách dat.
Hluboké učení je zvláště vhodné pro velké datové sady a modely často vyžadují, aby byly velké datové sady užitečné. Vzhledem ke složitosti sítě pro hluboké učení potřebuje síť k zaškolení sítě po tréninku značné množství tréninkových dat a dalších dat. V současné době vědci zdokonalují hluboké vzdělávací sítě, které mohou být efektivnější a používají menší soubory dat.
Strojové učení má variabilní požadavky na výkon počítače. Existuje spousta modelů, které lze provozovat na průměrném osobním počítači. Čím pokročilejší jsou statistické a matematické metody, tím těžší je, aby počítač rychle zpracovával data.
Hluboké učení bývá velmi náročné na zdroje. Analýza velkého množství informací prostřednictvím více vrstev rozhodování vyžaduje hodně výpočetní síly. Jak se počítače rychlejší, hluboké učení je stále dostupnější.
Tradičně strojové učení má několik společných a významných omezení. Overfitting je statistický problém, který může ovlivnit algoritmus strojového učení. Algoritmus strojového učení obsahuje určité množství „chyby“ při analýze a předpovídání pomocí dat. Algoritmus má ukázat vztah mezi relevantními proměnnými, ale při přeplnění začíná také zachycovat chybu, což vede k „hlučnějšímu“ nebo nepřesnému modelu. Modely strojového učení mohou být také zaujaté směrem k idiosynkrasiím dat, s nimiž byli školeni, což je problém, který je patrný zejména tehdy, když vědci trénují algoritmy na celém dostupném datovém souboru místo ukládání části dat, aby otestovali algoritmus proti.
Hluboké učení má stejné statistické úskalí jako klasické strojové učení, jakož i několik jedinečných problémů. Pro mnoho problémů není k dispozici dostatek dat pro trénování přiměřeně přesné sítě pro hluboké učení. Je často neúnosné nebo nemožné shromáždit více údajů nebo simulovat skutečný problém, což omezuje současný rozsah témat, pro která lze hloubkové učení použít..
Strojové učení a hluboké učení popisují metody výuky počítačů k učení a rozhodování. Hluboké učení je podmnožinou klasického strojového učení a díky některým důležitým rozdílům je hloubkové učení a strojové učení vhodné pro různé aplikace..