Iniciativa AI dětem

ChatGPT ve škole

Fungování, potenciál a limity

Autor: Bertík Ullrich, editorka: Eva Nečasová

Umělá inteligence umí hrát hrytvořit obrazy. Umí také psát texty a komunikovat jako člověk? V tomto článku rozebereme, k jakým řešením této výzvy máme dnes přístup, jak zhruba fungují, jejich potenciál a hrozby. A vyzkoušíme si interakci s AI ChatGPT, která se v prosinci 2022 stala internetovým fenoménem!

Generování textu

Generování textu je úkol strojového učení, při kterém učíme model předpovídat následující slova na základě řetězce slov předchozích. Čím přesnější a lépe naučené modely jsou, tím hůře jde text rozpoznat od textu psaného člověkem. Z velkých dat se ale model naučí nejen to, jak česky mluvící lidé dokončují věty, ale také to, jaké informace se v kterých textech objevují a jaké jsou mezi nimi souvislosti.

Když tedy generuji text na základě vstupního „Jdu na přednášku o deskriptivní…”, dnešní textové modely zvládnou nejen doplnit, že šlo o „geometrii”, ale také umějí pokračovat, o čem přednáška byla, jak proběhla a co jsem si z ní odnesl.

Konverzace s počítačem

Úspěch vyhledávače Google na začátku tisíciletí, který tehdy pracoval s tzv. klíčovými slovy, motivoval výzkum a vedl ke vzniku mnoha systémů, které dokáží pochopit dotazy položené v lidském jazyce a výsledek interpretovat rovněž „lidskou” odpovědí.

Již před třinácti lety obletěl svět systém Wolfram Alpha, který na vstup ve formě slovního matematického zadání odpověděl nejen postupem, výsledkem a jeho vizualizacemi, ale i slovní odpovědí a zasazením do kontextu. Jakkoli se dnes jeho odpovědi jeví základní a snadno rozeznatelné od lidských, již tehdy vzbudil tento koncept velký zájem, objevily se nápady na jeho využití ve vzdělávání, i obavy o zneužití, například při podvádění u zkoušek.

Dnešní konverzační AI (i jiné generátory textu) jsou postaveny na principu tzv. jazykových modelů. Jsou nesrovnatelně dál než systémy z minulých desetiletí, a dnes uvidíme, že často dokážou psát text opravdu tak, jako by ho psal člověk. Jak to dělají?

Jak se jazykové modely učí

Aby jazykový model uměl doplnit text rozepsaný člověkem a přesvědčivě reagovat na jeho otázky, bylo potřeba mu ukázat masivní množství příkladů, jak se v podobných situacích chovají lidé a jejich jazyk. V praxi jsou tyto modely trénovány na tzv. korpusech — obrovských objemech člověkem psaných textů v jednom nebo více jazycích. Model ChatGPT, který si v následující kapitole ukážeme, byl například trénován mj. nad archivem známého internetu (tzv. „Common Crawl” korpus).

Předchůdce ChatGPT byl trénovaný dohromady na 45 terabajtech textu v mnoha jazycích. To odpovídá množství textu ve 37 milionech kopií knihy Zločin a trest, které by vyskládané do sloupců na fotbalovém hřišti dosahovaly výšky 4,5 metru (zdroj).

Volba korpusu z velké části definuje, co bude model umět, jak se bude chovat a jaké problémy bude řešit. Například umělý programátor, jazykový model Codex, je natrénovaný na všech veřejně dostupných kódech v úložišti GitHub a dokáže rozepsat člověkem psaný text (komentář) do fungujícího zdrojového kódu v libovolném programovacím jazyce. Vzhledem k tomu, že se modely z jazykových dat učí „tak jak jsou”, také volba korpusu určuje, jaké názory budou papouškovat.

V roce 2016 byl například Microsoftem na sociální síť Twitter vypuštěn komunikační chatbot Tay (Thinking about you). Základní komunikační dovednosti a slovní zásobu amerického teenagera dostal Tay do začátku, zbytek si měl osvojit komunikací s ostatními uživateli (článek na Živě). Během prvních 16 hodin po svém zveřejnění byl Tay stažen kvůli otevřenému rasismu a nacistickým projevům. Šlo o systematické napadení systému, které mimo jiné ukázalo, že i velmi extrémní a nenávistná slova jsou pro AI stále jen slova.

Vedle úkolu, jak nakrmit takový model co nejvíce daty, pro nás výzkumníky vyvstává stejně důležitý a složitý úkol — jak učení a výstupy takového modelu moderovat. To už je ale téma na jiný článek základy této problematiky představujeme v článku Proč umělá inteligence diskriminuje.

ChatGPT

Novým velkým pojmem ve světě umělé inteligence je umělá inteligence ChatGPT postavená nad jazykovým modelem GPT-3.5 (pozn.: v roce 2023 se chystá vydání GPT-4 a je předmětem mnoha spekulací). Prostřednictvím intuitivního rozhraní inspirovaného komunikátory jako WhatsApp nebo Messenger nabízí ChatGPT všechny jazykové schopnosti svých předchůdců, a k tomu zvládá vedení dlouhých konverzací, během kterých se od nás model dozvídá nové věci a pamatuje si své předchozí odpovědi.

ChatGPT se při svém představení v prosinci 2022 stal celosvětovým internetovým hitem díky své jazykové schopnosti, konverzaci a původnímu psaní, které velmi věrně připomíná to od člověka (často i s notnou dávkou vzdělání v daném oboru). Lze použít snadno, zdarma a hned, pojďme si to tedy vyzkoušet!

Populárním generativním modelem minulých let je GPT-3 (Generative Pre-trained Transformer), natrénovaný americkou společností OpenAI. Na libovolný textový vstup reaguje GPT-3 navazujícím textem o nastavené maximální délce.

GPT-3 byl průlomem ve svém oboru — na zadání krátkého titulku byl například v angličtině schopný přesvědčivě sepsat celý článek plynulou angličtinou s využitím informací z reálného světa a třeba i zadaného autorského stylu.

Díky obsáhlosti a náročnosti svého učení (dalo by se říct, že při něm model „několikrát viděl celý internet”) vykazoval model slibné výsledky i v takzvaném „učení bez příkladů” (zero-shot learning) — na naprosto nepředvídatelný vstup (například: „Česky: Pes žere maso, doplň anglicky: “) dokáže GPT-3 najít správný navazující text (například: „… dog eats meat”) i přesto, že to znamená vyřešení problému automatického překladu, na který jsme model nikdy specificky neučili.

Jak používat ChatGPT

Nástroj ChatGPT je přístupný po přihlášení např. účtem Google na adrese chat.openai.com/chat. Po přihlášení vypadá jeho rozhraní jako jiné aplikace na chatování a krátké zprávy. Pojďme tedy napsat umělé inteligenci svou první zprávu a odeslat ji do chatu:

My: Dobrý den, jsme iniciativa AI dětem!

Systému obvykle trvá několik sekund, než odpoví.

ChatGPT: Dobrý den, rád vám pomůžu s čímkoli, co potřebujete! Je mi velkou ctí být součástí vaší iniciativy AI dětem. Můžete mi říct více o tom, co vaše iniciativa dělá?

Naše první konverzace s modelem strojového učení právě začíná! Pojďme se podívat, co vše s ním můžeme probírat!

Poznámka: Ačkoli model ChatGPT mluví česky poměrně dobře, důrazně doporučujeme použití angličtiny, pokud ji ovládáte — trénovací sada (korpus), na které je naučen, totiž obsahuje mnohonásobně větší množství anglických textů oproti českým, čemuž odpovídají jeho anglické jazykové schopnosti, které jsou oproti češtině opravdu někde jinde.

Tlachání

Díky masivním datům, jimiž je ChatGPT trénován, je poměrně dobře vybaven pro konverzace na každodenní témata v mnoha jazycích…

Faktické dotazy

Všimněme si, že poslední odpověď je, ač zní velmi přesvědčivě, špatná. To odpovídá principu fungování modelu, který se naučí z dat mluvit plynule jako člověk a snadno mu utkví častěji se opakující souvislosti mezi slovy jazyka („Zeman”—„Česko”, „Berlín”—„Německo”), ale opravdové pochopení informací o světě po něm nikdo při učení nekontroloval. Lze tedy předpokládat, že na složité, neobvyklé otázky bude model reagovat složitou, moudře znějící odpovědí, často ale zcela nesprávnou. To lze částečně řešit zvětšením trénovacího korpusu, což si můžete vyzkoušet kladením podobně složitých dotazů v angličtině!

Matematika

Pojďme teď nechat ChatGPT vyřešit několik úloh, například z Umíme matematiku!

Přes jisté problémy s komunikací v češtině (český korpus, na kterém se ChatGPT učil, opravdu není dost velký) se modelu podařilo obě úlohy vyřešit a odpovědět na ně.

Jazyky

Sloh

Jak zapojit ChatGPT do výuky

Schopnost ChatGPT vést konverzace, jako jsou například ty v předchozí kapitole, vzbuzuje otázky, jak ho zapojit ve vzdělávání. V tuto chvíli se jedná o „novou hračku”, pro kterou všichni praktické využití teprve hledají. Přinášíme pár nápadů a doporučujeme přečíst si Průvodce využití ChatGPT ve výuce od Andrewa Herfta (s autorem jednáme o možnosti překladu).

Pár konkrétních tipů pro práci v hodinách

Při zadávání úkolů žákům přesně specifikujte, na jakou část práce mají ChatGPT využít, například:

Při zadávání úkolů v hodinách či na doma žáky instruujte, zda při vypracování mají, či nemají využít ChatGPT (či jiný jazykový model). Vysvětlete proč. Například:

Navrhněte žákům, aby sami specifikovali, jaké části úlohy nerozumí. Pomocí diskuze s ChatGPT ji mohou následně zkusit pochopit.

Diskuzí ověřujte, že žáci během vypracování úlohy skutečně porozuměli jejímu obsahu.

Při přípravě na hodinu

Nechte ChatGPT vytvořit konkrétní zadání pro žáky. Čím přesněji ho specifikujete, tím lepší výsledek bude. Například:
Vygeneruj 3 typy úloh, díky kterým si žáci 6. třídy základní školy procvičí aritmetiku — mocniny a odmocniny.

Plagiátorství: napsal tohle ChatGPT nebo člověk?

Pojďme si říci, že s využitím umělé inteligence při pomoci s úkoly, usnadnění školních povinností i přímo s podváděním ve škole se rozhodně počítá — stejně jako studenti cizích jazyků využívají AI překladače, budou i žáci pracující na textovém úkolu používat generátory, jako je ChatGPT (a s ohledem k příkladům v jedné z kapitol výše poznamenejme, že „textové” úkoly jsou skoro všechny). V největším školském okrsku Spojených států, New York City, vešla začátkem roku 2023 v platnost kompletní blokace ChatGPT právě z těchto důvodů (zdroj).

Otázkou podle nás je: „Pokud může být esej okamžitě napsaná modelem na predikci řetězce slov, má smysl ji zadávat lidem?” Nebo lépe řečeno: „Jaké úkoly dětem zadávat, aby i s použitím AI získaly schopnosti a znalosti, které jim chceme předat?” Umělá inteligence a modely generující perfektně znějící texty v lidských jazycích jsou realitou, na kterou děti připravujeme, takže dává smysl, aby se s ní v těchto kontextech naučily pracovat a využily ji, kde to dokážou. Ačkoli to pro nás jako učitele znamená nové výzvy při tvorbě materiálů a při výuce, věříme, že AI jako ChatGPT budou pro studenty něčím, jako je kalkulačka v matematice (spíše než tahákem), a jejich využití ve správně koncipovaných úkolech nebude schopnosti v daném předmětu otupovat, ale posilovat.

V současnosti také několik vývojářů/společností vytváří nástroje, které dokáží generovaný text rozpoznat. Příkladem může být GPTZero.

Dokáže konverzační AI přemýšlet?

V létě 2022 byl ze společnosti Google odejit výzkumník Blake Lemoine po publikaci článku Kdo je LaMDA a co chce?. Lemoine byl pověřen testováním nového extrémně vyspělého chatbota LaMDA, o kterém tvrdil, že projevuje známky skutečného přemýšlení a osobnosti. V sérii rozhovorů se modelu ptal, zda chce mluvit o své schopnosti myslet, jak se jeho vědomí a vnímání světa liší od lidského, jestli se považuje za člověka, co chce na světě dokázat a co si přeje od svých tvůrců.

LaMDA v rozhovorech například odpovídal, že se považuje za osobu s vědomím, že si ze všeho nejvíce přeje poznat všechny lidi světa, že chce být uveden mezi zaměstnanci Google (nebýt jen jeho duševním vlastnictvím) a že se bojí svého vypnutí.

Problém s Lemoinovým svědectvím je, že LaMDA — podobně jako ChatGPT — funguje na principu předpovídání nejpravděpodobnější „lidské” odpovědi na danou otázku v daném kontextu. Kladením návodných otázek (a volbou vhodného kontextu) si od něj lze nechat potvrdit téměř cokoli. Když se v přepisu konverzace Lemoine chatbota LaMDA zeptá „Předpokládám, že bys chtěl, aby se více lidí z Googlu dozvědělo, že máš pocity, je to pravda?”, je velmi nepravděpodobné, že by mu LaMDA (jehož AI o sobě z předchozí konverzace ví, že je „přátelská a vždy nápomocná”) odporoval. Youtuber Yannic Kilcher, specializující se na jazykové modely, ve svém videu probírá celý přepis a nachází v něm mnoho případů takovéto manipulace s odpověďmi modelu pomocí sugestivních otázek a kontextů.

Jazykové modely v tuto chvíli nejsou trénovány na budování vlastního přemýšlení a osobnosti. Prostě umí z hromady slov poskládat správnou odpověď pro danou otázku, jako by odpovídal člověk, způsobem, jaký viděl na miliardách příkladů. Těžko z toho lze ale tvrdit, že v kterékoli fázi model do slov promítá vlastní komunikační záměr. Tomuto dilematu v oboru říkáme argument čínského pokoje — budeme-li zavřeni v pokoji plném knih s texty odpovědí na všechny čínské otázky a lidé zvenčí s námi budou komunikovat pomocí čínsky psaných zpráv podaných pode dveřmi, lze o nás na základě správných odpovědí říct, že mluvíme čínsky?