Obecný úvod do umělé inteligence

Jak se stroje učí

Doprovodné video ke kapitole

Autoři textu: Eva Nečasová, Vojtěch Jindra, odborný garant: Pavel Kordík

Strojové učení je jeden z nejpoužívanějších přístupů v oblasti umělé inteligence. Cílem jeho metod je odhalit vzory vyskytující se v datech. Místo toho, abychom stroji přesně popisovali nějaký postup, ukážeme mu velké množství příkladů, ze kterého se sám naučí, jak vykonávat konkrétní úlohu.

Co vlastně strojové učení znamená?

Stejně jako se člověk umí učit z příkladů a zkušeností, jsou toho schopny i člověkem vytvořené stroje. Rozdíl je v tom, že metody strojového učení nemají přehled o okolním světě a dokážou se zatím učit jen z dat, která jim byla předložena.

Lidé se občas ztrácejí v pojmech strojové učení a umělá inteligence. Řada systémů umělé inteligence je postavena právě pomocí strojového učení, ale nejedná se o jediný způsob. Vztah mezi těmito pojmy ilustruje následující obrázek.

Strojové učení přináší zásadní změnu ve způsobu, jakým vytváříme stroje. Místo toho, abychom jim přesně popisovali nějaký postup (algoritmus), ukážeme jim velké množství příkladů (nebo je necháme metodou pokus/omyl získávat zpětnou vazbu a posilovat strategie), ze kterých se samy naučí, jak vykonávat konkrétní úlohy.

Představte si to na příkladu robotů, které bychom chtěli naučit hrát fotbal. Pokud bychom se snažili napsat přesný postup pomocí algoritmů, který by popisoval všechny situace na hřišti a jak na ně mají roboti reagovat, bylo by to velmi zdlouhavé, ne-li nemožné. A tak místo toho vytvoříme pro roboty program, který je schopen se z mnoha příkladů naučit hrát fotbal sám. Třeba takhle:

Pokus a omyl

Stroje se ale nemusí učit pouze tím, že jim ukážeme příklady. Mohou se také učit „samy“ metodou pokus/omyl. A potřebují k tomu mnoho a mnoho pokusů (a zejména omylů). Podívejte se na následující simulaci. Cílem robotů je doběhnout závod na 100 metrů do 60 vteřin. Robotům ale nikdo nedal postup, jak toho mají dosáhnout — a tak tedy zkouší metodou pokus/omyl a samy si vytvářejí strategie pro dosažení cíle.

Model strojového učení

Takto se nazývá program, který se z mnoha příkladů učí, jak řešit různé úlohy. Trénování probíhá ve dvou fázích — trénování a testování. V trénovací fázi ukazujeme modelu množství příkladů (videa, obrázky, texty…), na nichž se trénuje tím, že vyhledává vzory (podobnosti). V testovací fázi ukazujeme modelu příklady, které ještě nikdy neviděl, a zjišťujeme, jak dobře funguje.

Co je zapotřebí k vytvoření modelu

K natrénování modelu vždy potřebujeme data. Pod pojmem data si můžete představit například tabulku, složku obrázků, složku textů. Ve většině případů obsahují data člověkem přiřazenou výstupní hodnotu (tzv. anotaci). U fotografií koček a psů může jít o informaci, kde na fotografii je kočka a kde pes. Můžeme mít různě velké množství dat, zpravidla ale platí, že s větším množstvím (kvalitních) dat roste kvalita fungování modelu.

Daty se snažíme pokrýt všechny možné scénáře, s kterými se model později ve svém životním cyklu může setkat. To pomáhá modelu k takzvané generalizaci, tzn. schopnosti modelu predikovat data dříve nespatřená.

Pro jednoduché modely nám stačí několik desítek datových vzorků. Složitější modely, například neuronové sítě, jsou běžně trénovány i na tabulkách s miliony řádků. Není snadné poznat, zda model funguje (generalizuje) správně. V některých oblastech již modely člověka předčily.

Typy strojového učení

Strojové učení — tedy způsob, jak se algoritmy samy zlepšují na základě dat a zpětné vazby — můžeme rozdělit do tří základních přístupů. V prvním (učení s učitelem) lidé předem označí správné odpovědi, ve druhém (učení bez učitele) model sám hledá vzory v neoznačených datech a ve třetím (posilované učení) se systém učí metodou pokus/omyl a zpětné vazby. Každý z nich se hodí pro jiné situace a úkoly. Podrobnosti rozvádíme níže.

Učení s učitelem

Pokud bychom chtěli vytvořit pomocí tohoto typu strojového učení aplikaci, která rozpoznává psy a kočky, museli bychom nejdříve systému umělé inteligence říci, na kterých obrázcích jsou kočky a na kterých psi (tzv. anotovat data). Lidé tedy plní úlohu učitelů, podle čehož se tento přístup nazývá.

Po rozdělení obrázků na kočky a psy bychom natrénovali model strojového učení a poté bychom mu ukazovali obrázky koček a psů, které ještě nikdy neviděl.

Sledovali bychom, zda zvíře určil správně. Pokud ne, vylepšili bychom datovou sadu a natrénovali model znovu.

Učení bez učitele

Někdy může být velmi zdlouhavé, nákladné či přímo nemožné všechna data anotovat. V takových případech využíváme strojové učení bez učitele.

Tento typ programu si vyhledává podobnosti (vzory) sám a vstupní data poté dokáže rozdělit do shluků (anglicky cluster), abychom se v datech my lidé lépe vyznali — a především pak snadno určili, co který shluk znamená.

Posilované učení

Někdy necháme stroje, aby něco zkoušely samy (metodou pokus/omyl), a následně jim dáváme zpětnou vazbu skrze tzv. politiky. Stroje si na základě zpětné vazby (skrze politiky) vyvíjejí strategie chování.

Jak se stroje učí

Doprovodné video ke kapitole

Co vlastně strojové učení znamená?

Pokus a omyl

Model strojového učení

Co je zapotřebí k vytvoření modelu

Typy strojového učení

Další kapitoly příručky

Co to je umělá inteligence

Stručná historie AI

K čemu nám AI slouží

Jak se stroje učí

Proč umělá inteligence diskriminuje

Etika umělé inteligence

Právo a legislativa

Ekologie a umělá inteligence

Kyberbezpečnost a AI

Vzdělávání a proměna pracovního trhu

Staňte se součástí naší cesty — pomozte nám vzdělávat pedagogy, vedení škol i děti v oblasti umělé inteligence.

AI dětem

Vzdělávací materiály

Vzdělávací akce

Příprava budoucích učitelů

Technologická řešení

AI dětem