Iniciativa AI dětem

Slovníček

V tomto slovníčku naleznete definice pojmů, které se nějakým způsobem vztahují k umělé inteligenci. Na slovníčku stále pracujeme, proto zatím neobsahuje mnoho hesel.

A

Žádná z definic termínu umělá inteligence vlastně není ustálená. Všechny se ale shodují v tom, že to je systém, který simuluje lidské myšlení a akce.

Umělá inteligence má obvykle formu počítačového programu a slouží k řešení úloh, k nimž byl dříve potřeba značný lidský intelekt, a byly tedy doménou lidí.

Je to také kromě jiného i vědecký obor s počátky sahajícími do první poloviny 20. století. Jeho důležitou vlastností je, že se inteligentním systémům snaží nejen porozumět, ale zejména je tvořit.

Více na: aidetem.cz/co-je-ai

B

Jedná se o různorodá data v mnoha formátech, lišící se velikostí a strukturou. Můžeme si je představit jako obrázky, videa, audia, texty nebo tzv. digitální stopy ve formě údajů o uživatelském chování.

Jsou důsledkem zrychlení a vývoje internetu, kdy jeho obsah vytváříme z velké míry my uživatelé.

Vznik velkých dat ovlivňuje také vývoj IoT technologií (internetu věcí), které dokážou získávat data ze všech možných zdrojů.

Roli hraje také výrazné zlevnění ukládání dat a jejich zpracování. Je jich typicky tolik, že jejich zpracování vyžaduje nové přístupy. Například takové, kdy jsou data ukládána a zpracovávána za pomoci velkého množství počítačů a jejich paměťových úložišť, a to platí i pro moderní metody strojového učení.

D

Velké množství dat, které se používá pro trénování modelů strojového učení. Mohou to být třeba hlasové záznamy, hudba, videa, obrazy, texty z knih, novin nebo sociálních sítí…

Volba datasetu z velké části definuje, co bude model umět, jak se bude chovat a jaké problémy bude řešit.

Dataset by měl být co největší. Měl by obsahovat kvalitní a pro daný úkol relevantní data, aby se zajistilo, že model bude dobře fungovat.

Difuzní modely generující obrazy, jako třeba Dall-E, Midjourney, Stable Diffusion se trénují tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

RS jsou jednou z technologií strojového učení. Jsou založeny na pozorování uživatelského chování, jeho vyhodnocování a doporučování vhodného obsahu.

Například pokud na YouTube zhlédneme video s koťaty, plaftorma nám nabídne další podobná. Nebo pokud systém vyhodnotí, že se my (uživatel A) chováme podobně jako uživatel B (oba koukáme na videa s koťaty a tuleni), nabídne nám jiná videa, která se líbí také uživateli B, přestože jsme na podobná videa doposud nereagovali.

RS vyhodnocují naše chování dvěma způsoby. Ukažme si to na příkladu hodnocení filmu. Explicitní způsob je ten, kdy film ohodnotíme hvězdičkami. Implicitní pak, zdali jsme film dokoukali, pustili si ho podruhé apod.

RS jsou hojně využívány k doporučování obsahu na sociálních sítích, streamovacích službách nebo vyhledávačích.

G

Generativní modely dovolují komukoliv snadno generovat obrazy na základě textových vstupů, kterým se říká prompty (výzva, podnět). Z uživatelského hlediska to funguje velmi jednoduše — textově popíšeme naši představu a AI z ní vytvoří obraz. V současnosti se využívají dva typy generativních modelů:

Difuzní modely (Dall-E 2, Midjourney, Stable Diffusion…)
Trénink difuzních modelů se provádí tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

GAN — Generativní adversariální sítě (StyleGAN…)
Obrazy se vytváří pomocí dvou neuronových sítí — generátoru a diskriminátoru. Ty spolu vzájemně soutěží a tím se motivují ke zlepšení. Generátor se snaží vytvořit nová data, která se co nejvíce podobají těm, na kterých byl natrénován. Diskriminátor je tu pak od toho, aby posoudil, zda se mu to podařilo.
Tento proces — kdy se oba modely navzájem trénují, je zopakován několikasetkrát, než je výsledný obraz hotov.

Více o generování: aidetem.cz/generovani-obrazu-pomoci-umele-inteligence

Typ generativní sítě, která vytváří obrazy pomocí dvou neuronových sítí — generátoru a diskriminátoru. Ty spolu vzájemně soutěží a tím se motivují ke zlepšení. Generátor se snaží vytvořit nová data, která se co nejvíce podobají těm, na kterých byl natrénován. Diskriminátor je tu pak od toho, aby posoudil, zda se mu to podařilo.
Tento proces — kdy se oba modely navzájem trénují, je zopakován několikasetkrát, než je výsledný obraz hotov.

Ch

ChatGPT aplikace využívající velký jazykový model vytvořený společností OpenAI. Dokáže vést konverzaci s uživateli v přirozeném jazyce. 

Informace, které ChatGPT poskytuje, nemusí být vždy pravdivé, odpovídat skutečnému stavu věcí, mohou být zavádějící i zcela smyšlené. Proto je vždy třeba je ověřovat i z jiných informačních zdrojů.

I

Schopnost přizpůsobovat se novým situacím, učit se a řešit výzvy. Zahrnuje kognitivní procesy jako myšlení, učení, vnímání, porozumění a komunikaci. Inteligence se projevuje v mnoha různých oblastech, včetně akademického úspěchu, pracovního výkonu, mezilidských vztahů a osobního rozvoje.

K

V kontextu strojového učení je korpus velké množství textů ve formě například knih, článků, receptů, příspěvků na sociálních sítích… až po hlasové záznamy.

Korpusy slouží pro trénování jazykových modelů strojového učení, jako je například ChatGPT. S nadsázkou lze říci, že volba korpusu určuje, jaké názory bude model papouškovat.

M

Takto se nazývá program, který se z mnoha příkladů učí, jak řešit různé úlohy. Učení probíhá ve dvou fázích — trénování a testování. V trénovací fázi ukazujeme modelu množství příkladů (videa, obrázky, texty…), na nichž se učí tím, že vyhledává vzory (podobnosti). V testovací fázi ukazujeme modelu příklady, které ještě nikdy neviděl, a zjišťujeme, jak dobře funguje.​

P

Technologie, která umělé inteligenci umožňuje poznávat a zařazovat objekty ve světě kolem nás. Pokud systémům rozpoznávání obrazu poskytneme data, mohou se podle nich naučit rozpoznávat cokoliv, od osob přes známé orientační body až třeba po domácí mazlíčky.

Počítačovým viděním se dnes můžeme přihlásit do mobilu ukázáním svého obličeje (Face ID), měřit vzdálenosti a hledat informace o objektech, které ani neumíme pojmenovat (Google Lens), nebo AI můžeme vzít třeba do lesa (BirdNET).

Díky přesnému rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě dospívá také technologie samořiditelných aut.

Více na: aidetem.cz/vyuziti-ai/#pocitacove-videni

Špatně připravená data nebo jejich nedostatek mohou způsobit, že umělá inteligence bude určitým způsobem předpojatá (zkreslená).

Pokud například budeme chtít, aby se umělá inteligence naučila rozpoznávat boty, ale budeme jí ukazovat výhradně obrázky tenisek, nebude boty na vysokém podpatku, sandály ani kozačky za boty považovat.

Aby systémy umělé inteligence byly etické a riziko zkreslení co nejnižší, programátoři a programátorky je v tomto duchu neustále ladí a jejich data pečlivě posuzují. To je jediný způsob, jak zajistit, aby systémy dobře pracovaly pro každého.

Více na: aidetem.cz/predpojatost

S

Stejně jako se člověk umí učit z příkladů a zkušeností, jsou toho schopny i člověkem vytvořené stroje.

Stroje k učení využívají metodu, která se nazývá strojové učení. Ta umožňuje systémům umělé inteligence, aby nebyly jen souborem předem naprogramovaných akcí, ale aby samy přicházely s novými řešeními.

Cílem metod strojového učení je odhalit vzory vyskytující se ve velkém množství dat.

Více na: aidetem.cz/strojove-uceni

U

V moderní, internetem propojené, společnosti nachází umělá inteligence svá uplatnění na mnoha místech. S AI a jejími rozhodnutími se dnes potkáme v práci, na nákupech i ve volném čase. Poradí nám nejkratší nebo nejekologičtější cestu, rozpozná rostlinu, doporučí obsah na sociálních sítích, hudbu nebo film, přeloží text, vygeneruje nebo vyhledá obrázek, rozpozná anomálie na rentgenových snímcích, zahraje si s námi hru, popovídáme si s ní nebo nás třeba někam doveze autem.

Více na: aidetem.cz/vyuziti-ai

V

Velký jazykový model (jako například GPT-4) je sofistikovaný počítačový program, který je určen k analýze a generování textu. Může být využit například pro strojový překlad, rozpoznávání řeči, generování odpovědí na otázky, či syntézu literálního díla.

Tyto modely jsou trénovány na obrovských objemech dat (tzv. korpusech) — například na datech získaných z internetu (Common Crawl), digitalizovaných knihách nebo Wikipedii.

Na světě je jich jen několik a jsou z důvodů nároků na počítačový hardware vytvářeny jen velkými společnostmi. V současnosti jsou nejznámější GPT-4 (OpenAI), Llama (Meta), LaMDA (DeepMind) nebo Gemini (Google).

Proces vzniku velkého jazykového modelu může být (velmi zjednodušeně) rozdělen do tří kroků:

— výběr korpusů: ty by měly být dostatečně velké a rozmanité,
— trénování modelu: model je trénován na datech pomocí algoritmů strojového učení,
— validace a testování: model je zkoušen na datech mimo trénovací sadu, upravován a dále vylepšován.

Nakonec je model nasazen pro reálné použití, například pro vedení konverzace (chatboti), překlad textů nebo jiné aplikace. K tomu je třeba zajistit, aby se chatbot dobře choval k uživatelům a nikomu neublížil.