Posilované strojové učení
Posilované učení (někdy se říká také zpětnovazební, v angličtině Reinforcement Learning) je typ strojového učení, kdy necháme stroje, aby něco zkoušely samy (metodou pokus / omyl), a následně jim dáváme zpětnou vazbu skrze tzv. politiky. Stroje si na základě vhodné zpětné vazby vyvíjejí strategie chování. Například, pokud bychom chtěli vyvinout robota, který se naučí procházet bludištěm, robot by získával pozitivní odměnu za každý krok správným směrem a negativní odměnu za chyby nebo slepé uličky. Postupně by se tak naučil najít optimální cestu bludištěm.