Iniciativa AI dětem

Slovníček

V tomto slovníčku naleznete definice pojmů, které se nějakým způsobem vztahují k umělé inteligenci. Je doplňkem ke vzdělávacím materiálům, které v AI dětem vytváříme. Je třeba vzít v potaz jisté zjednodušení pro srozumitelnost některých termínů.

A

Žádná z definic termínu umělá inteligence vlastně není ustálená. Všechny se ale shodují v tom, že to je systém, který simuluje lidské myšlení a akce.

Umělá inteligence má obvykle formu počítačového programu a slouží k řešení úloh, k nimž byl dříve potřeba značný lidský intelekt, a byly tedy doménou lidí.

Je to také kromě jiného i vědecký obor s počátky sahajícími do první poloviny 20. století. Jeho důležitou vlastností je, že se inteligentním systémům snaží nejen porozumět, ale zejména je tvořit.

Více na: aidetem.cz/co-je-ai

Virtuální postava vytvořená pomocí generativní umělé inteligence, která je navržena tak, aby působila jako skutečný influencer na sociálních platformách. Může působit, jako by měla vlastní osobnost, zájmy a interakce. Často bývá vytvořena k marketingovým účelům, propagaci značek, produktů nebo služeb. Může se prezentovat obsahem jako fotografie, videa, hudba, texty apod. Skrze komentáře může také interagovat s uživateli. Pravděpodobně nejznámější je AI influencerka Lil Miquela s cca 2,6 miliony sledujícími na Instagramu.

Algoritmus je podrobný, krok za krokem definovaný postup pro vyřešení určitého problému nebo úkolu. Je to sada pravidel nebo instrukcí, které popisují, jak dosáhnout výsledku nebo řešení problému. Není vázán na žádný konkrétní programovací jazyk. Může být vyjádřen přirozeným jazykem, pseudokódem apod.
Algoritmus je abstraktní koncept. Jeho hlavním cílem je popsat logiku řešení krok za krokem.

Analýza sentimentu je proces, který umožňuje systémům umělé inteligence rozpoznat a interpretovat emoce v textu. Při jeho analýze se systém dívá na slova a fráze, aby určil, zda je výpověď pozitivní, negativní nebo neutrální. Tato technologie se využívá v široké škále aplikací, od monitorování značek a produktů na sociálních médiích, přes zlepšování zákaznického servisu, až po vývoj interaktivních chatbotů a asistentů, kteří jsou schopni empatičtější komunikace s uživateli.

B

Jedná se o různorodá data v mnoha formátech, lišící se velikostí a strukturou. Můžeme si je představit jako obrázky, videa, audia, texty nebo tzv. digitální stopy ve formě údajů o uživatelském chování.

Jsou důsledkem zrychlení a vývoje internetu, kdy jeho obsah vytváříme z velké míry my uživatelé.

Vznik velkých dat ovlivňuje také vývoj IoT technologií (internetu věcí), které dokážou získávat data ze všech možných zdrojů.

Roli hraje také výrazné zlevnění ukládání dat a jejich zpracování. Je jich typicky tolik, že jejich zpracování vyžaduje nové přístupy. Například takové, kdy jsou data ukládána a zpracovávána za pomoci velkého množství počítačů a jejich paměťových úložišť, a to platí i pro moderní metody strojového učení.

D

Data jsou v obecné rovině údaje, které lze použít k řešení různých problémů, pro rozhodování
nebo k pochopení světa kolem nás. Pokud datům přiřadíme smysl nebo význam, vzniká informace.

Počítače a další zařízení pracují s digitálními daty. Ta popisují nějakou část reálného světa
kolem nás ve formě vhodné k počítačovému zpracování. Existují různé typy, můžeme je dělit třeba na:

  1. texty (znaky, slova, čísla…)
  2. obrázky (fotografie, kresby, grafy, gify…)
  3. videa (multimédia — propojení obrazu a zvuku, například záznam z dovolené, animovaný příběh…)
  4. audio (telefonní hovory, hudba…)
  5. 3D objekty (pro 3D tisk, postavy nebo objekty ve hrách…)

Velké množství dat, které se používá pro trénování modelů strojového učení. Mohou to být třeba hlasové záznamy, hudba, videa, obrazy, texty z knih, novin nebo sociálních sítí…

Volba datasetu z velké části definuje, co bude model umět, jak se bude chovat a jaké problémy bude řešit.

Dataset by měl být co největší. Měl by obsahovat kvalitní a pro daný úkol relevantní data, aby se zajistilo, že model bude dobře fungovat.

Pojem deepfake v sobě zahrnuje dvě slova: „deep“, jež odkazuje na hluboké neuronové sítě a „fake“, což znamená falešný. Deefake je za pomocí generativní umělé inteligence zmanipulovaný nebo kompletně vygenerovaný digitální obsah — obrázky, texty, videa, audio apod.

Difuzní modely generující obrazy, jako třeba Dall-E, Midjourney, Stable Diffusion se trénují tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

Proces úpravy digitálního obsahu, např. obrazu, videa, audia, textu apod., se záměrem ovlivnit jeho konzumenta. Ovšem ne vždy v negativním kontextu, například chytré fotoaparáty mají často funkce, které zeštíhlují obličej apod. Generativní AI přináší do této oblasti zásadní změny, avšak digitální manipulace má své hluboké kořeny v lidské historii. Často se uvádí příklad retušování nepřátel Josifa Stalina z fotografií ve 30. letech minulého století. V současnosti je tento pojem úzce spjat s tzv. deepfakes.

RS jsou jednou z technologií strojového učení. Jsou založeny na pozorování uživatelského chování, jeho vyhodnocování a doporučování vhodného obsahu.

Například pokud na YouTube zhlédneme video s koťaty, plaftorma nám nabídne další podobná. Nebo pokud systém vyhodnotí, že se my (uživatel A) chováme podobně jako uživatel B (oba koukáme na videa s koťaty a tuleni), nabídne nám jiná videa, která se líbí také uživateli B, přestože jsme na podobná videa doposud nereagovali.

RS vyhodnocují naše chování dvěma způsoby. Ukažme si to na příkladu hodnocení filmu. Explicitní způsob je ten, kdy film ohodnotíme hvězdičkami. Implicitní pak, zdali jsme film dokoukali, pustili si ho podruhé apod.

RS jsou hojně využívány k doporučování obsahu na sociálních sítích, streamovacích službách nebo vyhledávačích.

F

Technika, který umožňuje snadno a rychle zaměnit tváře na fotografiích nebo ve videích. Využívá počítačové vidění pro rozpoznávání obličejů a pokročilé algoritmy umělé inteligence k detekci a mapování obličejových rysů, což umožňuje přesné nahrazení jednoho obličeje obličejem někoho jiného. Face Swap se běžně používá pro zábavu v mobilních aplikacích a na sociálních sítích, ale také například v (často nekonsenzuální) pornografii.

G

Generativní umělá inteligence je typ umělé inteligence, který je navržen k vytváření nového obsahu, jako jsou texty, obrázky, hudba, videa a podobně, na základě dat, na kterých byla natrénována. Na rozdíl od tradičních systémů AI, které se zaměřují na analýzu nebo klasifikaci informací, generativní AI používá algoritmy, jako jsou neuronové sítě, k „naučení se“ stylu a struktury existujících dat, aby mohla generovat nový, originální obsah, který je často těžko odlišitelný od obsahu vytvořeného lidmi. Tato technologie nachází uplatnění v mnoha oblastech, včetně umění, designu, tvorby her, a dokonce i v generování textů pro zprávy nebo sociální média.

Generativní modely dovolují komukoliv snadno generovat obrazy na základě textových vstupů, kterým se říká prompty (výzva, podnět). Z uživatelského hlediska to funguje velmi jednoduše — textově popíšeme naši představu a AI z ní vytvoří obraz. V současnosti se využívají dva typy generativních modelů:

Difuzní modely (Dall-E 2, Midjourney, Stable Diffusion…)
Trénink difuzních modelů se provádí tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

GAN — Generativní adversariální sítě (StyleGAN…)
Obrazy se vytváří pomocí dvou neuronových sítí — generátoru a diskriminátoru. Ty spolu vzájemně soutěží a tím se motivují ke zlepšení. Generátor se snaží vytvořit nová data, která se co nejvíce podobají těm, na kterých byl natrénován. Diskriminátor je tu pak od toho, aby posoudil, zda se mu to podařilo.
Tento proces — kdy se oba modely navzájem trénují, je zopakován několikasetkrát, než je výsledný obraz hotov.

Více o generování: aidetem.cz/generovani-obrazu-pomoci-umele-inteligence

Typ generativní sítě, která vytváří obrazy pomocí dvou neuronových sítí — generátoru a diskriminátoru. Ty spolu vzájemně soutěží a tím se motivují ke zlepšení. Generátor se snaží vytvořit nová data, která se co nejvíce podobají těm, na kterých byl natrénován. Diskriminátor je tu pak od toho, aby posoudil, zda se mu to podařilo.
Tento proces — kdy se oba modely navzájem trénují, je zopakován několikasetkrát, než je výsledný obraz hotov.

Ch

ChatGPT aplikace využívající velký jazykový model vytvořený společností OpenAI. Dokáže vést konverzaci s uživateli v přirozeném jazyce. 

Informace, které ChatGPT poskytuje, nemusí být vždy pravdivé, odpovídat skutečnému stavu věcí, mohou být zavádějící i zcela smyšlené. Proto je vždy třeba je ověřovat i z jiných informačních zdrojů.

I

Schopnost přizpůsobovat se novým situacím, učit se a řešit výzvy. Zahrnuje kognitivní procesy jako myšlení, učení, vnímání, porozumění a komunikaci. Inteligence se projevuje v mnoha různých oblastech, včetně akademického úspěchu, pracovního výkonu, mezilidských vztahů a osobního rozvoje.

K

V kontextu strojového učení je korpus velké množství textů ve formě například knih, článků, receptů, příspěvků na sociálních sítích… až po hlasové záznamy.

Korpusy slouží pro trénování jazykových modelů strojového učení, jako je například ChatGPT. S nadsázkou lze říci, že volba korpusu určuje, jaké názory bude model papouškovat.

M

Takto se nazývá program, který se z mnoha příkladů nebo zkušeností učí, jak řešit různé úlohy. Učení probíhá ve dvou fázích — trénování a testování. V trénovací fázi ukazujeme modelu množství příkladů (videa, obrázky, texty…), na nichž se učí tím, že vyhledává vzory (podobnosti). V testovací fázi ukazujeme modelu příklady, které ještě nikdy neviděl, a zjišťujeme, jak dobře funguje.​

O

Velká pětka nebo také OCEAN model je široce používán v psychologii a při výzkumu osobnosti. Popisuje spektrum lidského chování a osobnostních rysů. Obsahuje pět základních dimenzí: otevřenost vůči zkušenostem, svědomitost, extraverze, přívětivost a neuroticismus. Tyto dimenze poskytují široký přehled o jedinečných psychologických charakteristikách jednotlivce a předpovídají různé aspekty jeho chování a mezilidských vztahů. Model se používá v mnoha oblastech, včetně psychologického výzkumu, personálního hodnocení a marketingu, pro lepší porozumění lidské povaze.

P

Technologie, která umělé inteligenci umožňuje poznávat a zařazovat objekty ve světě kolem nás. Pokud systémům rozpoznávání obrazu poskytneme data, mohou se podle nich naučit rozpoznávat cokoliv, od osob přes známé orientační body až třeba po domácí mazlíčky.

Počítačovým viděním se dnes můžeme přihlásit do mobilu ukázáním svého obličeje (Face ID), měřit vzdálenosti a hledat informace o objektech, které ani neumíme pojmenovat (Google Lens), nebo AI můžeme vzít třeba do lesa (BirdNET).

Díky přesnému rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě dospívá také technologie samořiditelných aut.

Více na: aidetem.cz/vyuziti-ai/#pocitacove-videni

Program je konkrétní využití jednoho nebo více algoritmů v určitém programovacím jazyce. Je to soubor instrukcí, který strojům říká, co mají dělat, aby splnily zadanou úlohu.

Tedy zatímco algoritmus je obecný popis toho, jak vyřešit problém, program je konkrétní realizací tohoto řešení v určitém programovacím jazyce.

Špatně připravená data nebo jejich nedostatek mohou způsobit, že umělá inteligence bude určitým způsobem předpojatá (zkreslená).

Pokud například budeme chtít, aby se umělá inteligence naučila rozpoznávat boty, ale budeme jí ukazovat výhradně obrázky tenisek, nebude boty na vysokém podpatku, sandály ani kozačky za boty považovat.

Aby systémy umělé inteligence byly etické a riziko zkreslení co nejnižší, programátoři a programátorky je v tomto duchu neustále ladí a jejich data pečlivě posuzují. To je jediný způsob, jak zajistit, aby systémy dobře pracovaly pro každého.

Více na: aidetem.cz/predpojatost

Příznak ve strojovém učení (v angličtině feature) je jednotlivá měřitelná vlastnost nebo charakteristika dat, kterou lze použít pro analýzu. Představte si, že chcete, aby počítač rozpoznal, zda je na obrázku kočka. Příznaky mohou zahrnovat velikost obrázku, barvu, tvar uší, délku ocasu a mnoho dalších. Tyto informace pomáhají počítačovému modelu rozhodnout, zda je na obrázku kočka nebo ne. V kontextu strojového učení jsou příznaky základními stavebními kameny, z nichž modely „učí“ rozpoznávat vzory nebo provádět predikce. Správný výběr a příprava příznaků může výrazně zlepšit výkon a přesnost modelu.

R

Proces, který umožňuje systémům umělé inteligence analyzovat a interpretovat lidské emoce z výrazu tváře. Používá se k tomu kombinace počítačového vidění a strojového učení, které dokáže identifikovat specifické rysy tváře, jako jsou úsměv, zamračení, zvednuté obočí atd., a na základě těchto rysů určit, jakou emoci člověk vyjadřuje. Například, systém může rozpoznat, že pokud má někdo zvednuté koutky úst, pravděpodobně se směje nebo je šťastný. Tato technologie nachází uplatnění v různých oblastech, od vylepšení zákaznického servisu, přes bezpečnostní aplikace, až po vývoj pokročilých interaktivních hraček a robotů, které mohou lépe interagovat s lidmi na základě jejich emocionálního stavu.
Proces, při kterém systém umělé inteligence analyzuje lidský hlas za účelem identifikace emocionálního stavu mluvčího. Tato technologie se opírá o analýzu různých akustických vlastností hlasu, jako je tón, síla, rychlost a intonace, aby odhalila, jaké emoce osoba prožívá. Například, výška hlasu a rychlost mluvy mohou naznačovat vzrušení nebo stres, zatímco monotónní hlas může ukazovat na smutek nebo únavu. Rozpoznávání emocí v hlase má široké uplatnění. V zákaznickém servisu může pomoci identifikovat nespokojené nebo frustrované zákazníky, aby bylo možné lépe reagovat na jejich potřeby. Ve zdravotnictví může přispět k diagnostice a monitorování duševního zdraví na základě změn v emocionálním projevu pacienta. Rozpoznávání emocí v hlase tak otevírá nové možnosti pro vytváření citlivějších a intuitivnějších technologických řešení.

S

Stejně jako se člověk umí učit z příkladů a zkušeností, jsou toho schopny i člověkem vytvořené stroje.

Stroje k učení využívají metodu, která se nazývá strojové učení. Ta umožňuje systémům umělé inteligence, aby nebyly jen souborem předem naprogramovaných akcí, ale aby samy přicházely s novými řešeními.

Cílem metod strojového učení je odhalit vzory vyskytující se ve velkém množství dat.

Více na: aidetem.cz/strojove-uceni

Strojové učení s učitelem je jedním ze způsobů, jak se systémy umělé inteligence mohou učit — v tomto případě například rozpoznávat objekty na obrázcích nebo videích. Pokud bychom chtěli vytvořit aplikaci, která rozpoznává psy a kočky, museli bychom nejdříve programu říci, na kterých obrázcích jsou kočky a na kterých psi (tzv. anotovat data). Lidé tedy plní úlohu učitelů, a proto se tento přístup nazývá „s učitelem“.

Po anotaci obrázků na kočky a psy bychom program natrénovali a poté bychom mu ukazovali obrázky koček a psů, které ještě nikdy neviděl, a sledovali bychom, zda zvíře určil správně. Pokud by program chyboval, vylepšili bychom datovou sadu (například přidáním více obrázků koček a psů) a model natrénovali znovu.

Více na: aidetem.cz/kurz…

Strojové učení bez učitele je typ strojového učení, kde se systém učí z neoznačených dat. Tento přístup nevyžaduje, aby lidé předem označili (anotovali) data (například fotografie, kde je kočka nebo pes). Místo toho se algoritmy snaží najít vzory nebo struktury v datech samostatně. Například, pokud bychom měli sadu obrázků bez označení, algoritmus by mohl seskupit podobné obrázky dohromady (tzv. shlukování) nebo snížit jejich rozměrnost (zjednodušit) a odhalit tak základní strukturu.

Více na: aidetem.cz/kurz…

 

Posilované učení (někdy se říká také zpětnovazební) je typ strojového učení, kdy necháme stroje, aby něco zkoušely samy (metodou pokus/omyl), a následně jim dáváme zpětnou vazbu skrze tzv. politiky. Stroje si na základě zpětné vazby vhodné vyvíjejí strategie chování. Například, pokud bychom chtěli vyvinout robota, který se naučí procházet bludištěm, robot by získával pozitivní odměnu za každý krok správným směrem a negativní odměnu za chyby nebo slepé uličky. Postupně by se tak naučil najít optimální cestu bludištěm.

Více na: aidetem.cz/kurz…

Syntetická média jsou taková, která byla vytvořena pomocí generativní umělé inteligence. Mohou to být například obrázky, videa, texty, audio a další.

Pojem syntetická realita byl dříve spojován s 3D prostředím (částečně nebo zcela generovaným umělou inteligencí) metaverse, do kterého by se přistupovalo pomocí virtuální reality. V poslední době se však stále častěji hovoří v kontextu syntetické reality, případně syntetických realit, také jako o umělých konstruktech, který byly vytvořeny s využitím nástrojů generativní AI. Tento pojem je také často spojován s tzv. deepfakes.

U

V moderní, internetem propojené, společnosti nachází umělá inteligence svá uplatnění na mnoha místech. S AI a jejími rozhodnutími se dnes potkáme v práci, na nákupech i ve volném čase. Poradí nám nejkratší nebo nejekologičtější cestu, rozpozná rostlinu, doporučí obsah na sociálních sítích, hudbu nebo film, přeloží text, vygeneruje nebo vyhledá obrázek, rozpozná anomálie na rentgenových snímcích, zahraje si s námi hru, popovídáme si s ní nebo nás třeba někam doveze autem.

Více na: aidetem.cz/vyuziti-ai

Chování uživatelů pohybujících se v prostředí internetu pokrývá všechny aktivity, které uživatel na internetu vykonává. Měnilo se spolu s jeho vývojem. První uživatelskou platformou byl tzv. web 1.0, jehož podstatou bylo pasivní přijímání obsahu uživatelem. Uživatelům tedy poskytoval minimální prostor pro vlastní produkci, protože webové stránky byly vytvářeny malým počtem tvůrců. Další etapu ve vývoji internetu představuje web 2.0, o kterém se hovoří zhruba od roku 2004. Jeho charakteristickým rysem je aktivní zapojení uživatele do tvorby obsahu. Tato proměna měla za následek enormní nárust dat, ze kterých se mohou učit systémy umělé inteligence. Internet se pomalu proměňuje do webu 3.0, s nímž jsou spojeny termíny jako například cloudové služby, internet věcí či sémantický web.

V

Velký jazykový model (jako například GPT-4) je sofistikovaný počítačový program, který je určen k analýze a generování textu. Může být využit například pro strojový překlad, rozpoznávání řeči, generování odpovědí na otázky, či syntézu literálního díla.

Tyto modely jsou trénovány na obrovských objemech dat (tzv. korpusech) — například na datech získaných z internetu (Common Crawl), digitalizovaných knihách nebo Wikipedii.

Na světě je jich jen několik a jsou z důvodů nároků na počítačový hardware vytvářeny jen velkými společnostmi. V současnosti jsou nejznámější GPT-4 (OpenAI), Llama (Meta), LaMDA (DeepMind) nebo Gemini (Google).

Proces vzniku velkého jazykového modelu může být (velmi zjednodušeně) rozdělen do tří kroků:

— výběr korpusů: ty by měly být dostatečně velké a rozmanité,
— trénování modelu: model je trénován na datech pomocí algoritmů strojového učení,
— validace a testování: model je zkoušen na datech mimo trénovací sadu, upravován a dále vylepšován.

Nakonec je model nasazen pro reálné použití, například pro vedení konverzace (chatboti), překlad textů nebo jiné aplikace. K tomu je třeba zajistit, aby se chatbot dobře choval k uživatelům a nikomu neublížil.