Hluboké i zesílené učení je vysoce spojeno s výpočetní silou umělé inteligence (AI). Jsou to autonomní funkce strojového učení, které dláždí cestu počítačům k vytváření vlastních principů při řešení. Tyto dva druhy učení mohou také koexistovat v několika programech. Obecně platí, že hluboké učení využívá současná data, zatímco posilování učení využívá metodu pokusů a omylů při určování předpovědí. Následující diskuse se dále ponoří do těchto rozdílů.
Hluboké učení se také nazývá hluboké strukturované učení nebo hierarchické učení. Toto bylo poprvé představeno v roce 1986 Rinou Dechterovou, profesorkou informatiky. Využívá současné informace ve výukových algoritmech k hledání příslušných vzorců, které jsou nezbytné pro předpovídání dat. Takový systém využívá různé úrovně umělých neuronových sítí podobných neuronálnímu složení lidského mozku. Pomocí složitých odkazů může být algoritmus schopen zpracovat miliony informací a zón v konkrétnější predikci.
Tento druh učení lze použít, když vývojáři chtějí, aby software našel fialovou barvu na různých obrázcích. Program by byl potom napájen množstvím obrázků (tedy „hluboké“ učení) s fialovými barvami a bez nich. Prostřednictvím shlukování bude program schopen identifikovat vzory a zjistit, kdy označit barvu jako fialovou. Hluboké učení se používá v různých programech rozpoznávání, jako jsou analýzy obrázků a předpovědní úkoly, například v předpovědích časové řady.
Zesílení učení obvykle zjistí předpovědi pomocí pokusu a omylu. Pokud jde o jeho historii z pohledu AI, byla vyvinuta na konci 80. let; to bylo založeno na výsledcích pokusů na zvířatech, koncepcích optimálního řízení a metod časově diferencovaných. Spolu s učením pod dohledem a bez dozoru je posilování jedním ze základních paradigmat v strojovém učení. Jak název napovídá, algoritmus je trénován prostřednictvím odměn.
Například AI je vyvinuto pro hraní s lidmi v určité mobilní hře. Pokaždé, když AI ztratí, je algoritmus revidován, aby se maximalizovalo jeho skóre. Tento druh techniky se tak učí ze svých chyb. Po četných cyklech se AI vyvinula a zlepšila se v porážce lidských hráčů. Výztužná výuka se používá v nejmodernějších technologiích, jako je zlepšování robotiky, těžba textu a zdravotní péče.
Hluboké učení je schopno provést cílové chování analýzou existujících dat a použitím toho, co se naučilo, na novou sadu informací. Na druhé straně je učení posilování schopné změnit svou reakci přizpůsobením nepřetržité zpětné vazby.
Hluboké učení pracuje s již existujícími daty, protože je to nezbytné při tréninku algoritmu. Pokud jde o posilování učení, má charakter průzkumu a může být vyvíjen bez aktuálního souboru údajů, protože se učí pomocí pokusů a omylů.
Hluboké učení se používá při rozpoznávání obrazu a řeči, předškolení v síti a při snižování rozměrů. Ve srovnání se učení vyztužení využívá při interakci s vnějšími podněty s optimálním řízením, jako je robotika, plánování výtahů, telekomunikace, počítačové hry a zdravotní péče o zdraví..
Hluboké učení je také známé jako hierarchické učení nebo hluboké strukturované učení, zatímco posilovací učení nemá žádné další široce známé pojmy.
Hluboké učení je jednou z mnoha metod strojového učení. Na druhé straně je posilovací učení oblastí strojového učení; je to jedno ze tří základních paradigmat.
Ve srovnání s hlubokým učením je posilovací učení blíže schopnostem lidského mozku, protože tento druh inteligence může být zlepšen zpětnou vazbou. Hluboké učení je hlavně pro uznání a je méně spojeno s interakcí.
Hluboké učení bylo poprvé představeno v roce 1986 Rinou Dechterovou, zatímco posilovací učení bylo vyvinuto na konci 80. let na základě konceptů pokusů na zvířatech, optimálního řízení a metod časově diferencovaných.