Žádná z definic termínu umělá inteligence vlastně není ustálená. Všechny se ale shodují v tom, že to je systém, který simuluje lidské myšlení a akce.
Umělá inteligence má obvykle formu počítačového programu a slouží k řešení úloh, k nimž byl dříve potřeba značný lidský intelekt, a byly tedy doménou lidí.
Je to také kromě jiného i vědecký obor s počátky sahajícími do první poloviny 20. století. Jeho důležitou vlastností je, že se inteligentním systémům snaží nejen porozumět, ale zejména je tvořit.
Více na: aidetem.cz/co-je-ai
Jedná se o různorodá data v mnoha formátech, lišící se velikostí a strukturou. Můžeme si je představit jako obrázky, videa, audia, texty nebo tzv. digitální stopy ve formě údajů o uživatelském chování.
Jsou důsledkem zrychlení a vývoje internetu, kdy jeho obsah vytváříme z velké míry my uživatelé.
Vznik velkých dat ovlivňuje také vývoj IoT technologií (internetu věcí), které dokážou získávat data ze všech možných zdrojů.
Roli hraje také výrazné zlevnění ukládání dat a jejich zpracování. Je jich typicky tolik, že jejich zpracování vyžaduje nové přístupy. Například takové, kdy jsou data ukládána a zpracovávána za pomoci velkého množství počítačů a jejich paměťových úložišť, a to platí i pro moderní metody strojového učení.
Velké množství dat, které se používá pro trénování modelů strojového učení. Mohou to být třeba hlasové záznamy, hudba, videa, obrazy, texty z knih, novin nebo sociálních sítí…
Volba datasetu z velké části definuje, co bude model umět, jak se bude chovat a jaké problémy bude řešit.
Dataset by měl být co největší. Měl by obsahovat kvalitní a pro daný úkol relevantní data, aby se zajistilo, že model bude dobře fungovat.
RS jsou jednou z technologií strojového učení. Jsou založeny na pozorování uživatelského chování, jeho vyhodnocování a doporučování vhodného obsahu.
Například pokud na YouTube zhlédneme video s koťaty, plaftorma nám nabídne další podobná. Nebo pokud systém vyhodnotí, že se my (uživatel A) chováme podobně jako uživatel B (oba koukáme na videa s koťaty a tuleni), nabídne nám jiná videa, která se líbí také uživateli B, přestože jsme na podobná videa doposud nereagovali.
RS vyhodnocují naše chování dvěma způsoby. Ukažme si to na příkladu hodnocení filmu. Explicitní způsob je ten, kdy film ohodnotíme hvězdičkami. Implicitní pak, zdali jsme film dokoukali, pustili si ho podruhé apod.
RS jsou hojně využívány k doporučování obsahu na sociálních sítích, streamovacích službách nebo vyhledávačích.
Generativní modely dovolují komukoliv snadno generovat obrazy na základě textových vstupů, kterým se říká prompty. Z uživatelského hlediska to funguje velmi jednoduše — textově popíšeme naši představu
a AI z ní vytvoří obraz. V současnosti se využívají dva typy generativních modelů:
Difuzní modely (Dall-E 2, Midjourney, Stable Diffusion…)
Trénink difuzních modelů se provádí tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy a vytváří tak realistické obrazy z původního šumu.
GAN — Generativní adversariální sítě (StyleGAN…)
Obrazy se vytváří pomocí dvou neuronových sítí — generátoru a diskriminátoru. Ty spolu vzájemně soutěží a tím se motivují ke zlepšení. Generátor se snaží vytvořit nová data, která se co nejvíce podobají těm, na kterých byl natrénován. Diskriminátor je tu pak od toho, aby posoudil, zda se mu to podařilo.
Tento proces — kdy se oba modely navzájem trénují, je zopakován několikasetkrát, než je výsledný obraz hotov.
Více o generování: aidetem.cz/generovani-obrazu-pomoci-umele-inteligence
ChatGPT je velký jazykový model vytvořený společností OpenAI. Dokáže vést konverzaci s uživateli většinou dobře formulovanými odpovědmi v mnoha oblastech. Aby vznikl, bylo třeba mu ukázat masivní množství příkladů, jak se v různých situacích chovají lidé a jejich jazyk. V praxi jsou tyto modely trénovány na tzv. korpusech — obrovských objemech textů v jednom nebo více jazycích (např. Wikipedie, digitalizované knihy, atd.).
Informace, které ChatGPT poskytuje, nemusí být vždy pravdivé, odpovídat skutečnému stavu věcí, mohou být zavádějící i zcela smyšlené. Proto je vždy třeba je ověřovat i z jiných informačních zdrojů.
Rovněž nemůže poskytnout aktuální informace, protože data, z nichž čerpá, jsou omezena rokem
2021 (stav k lednu 2023).
Schopnost přizpůsobovat se novým situacím, učit se a řešit výzvy. Zahrnuje kognitivní procesy jako myšlení, učení, vnímání, porozumění a komunikaci. Inteligence se projevuje v mnoha různých oblastech, včetně akademického úspěchu, pracovního výkonu, mezilidských vztahů a osobního rozvoje.
Teorie inteligence Howarda Gardnera předpokládá existenci osmi základních typů inteligence, každý s vlastními charakteristikami a schopnostmi.
Tyto typy inteligence jsou:
Lingvistická inteligence — schopnost používat slova účinně v mluvené i písemné formě, interpretovat a používat jazyk jako nástroj k myšlení.
Matematicko-logická inteligence — schopnost logicky uvažovat, rozumět číselnému a matematickému řešení problémů.
Vizuální a prostorová inteligence — schopnost vnímat a pracovat s vizuálními vjemy, představit si a vizualizovat objekty, prostory a vztahy mezi nimi.
Zvukově-hudební inteligence — schopnost rozumět a vytvářet hudbu, vnímat a pracovat s rytmem, melodií a harmonií.
Tělesně-pohybová inteligence — schopnost vyjadřovat se prostřednictvím pohybu, tanečního umění nebo sportu, manuální zručnost.
Interpersonální inteligence — schopnost rozumět ostatním lidem, navazovat vztahy, pochopit jejich motivace a emoce a efektivně komunikovat.
Intrapersonální inteligence — schopnost porozumět sobě a ovládat své vlastní myšlenky, pocity a emoce.
Přírodní inteligence — schopnost rozumět přírodním jevům a vztahům mezi živými organismy a prostředím.
Podle Gardnera by měla být inteligence chápána jako množina různých schopností, které spolu souvisí. Každý jedinec má v každém z těchto typů inteligence jinou úroveň zdatnosti. Gardnerova teorie inteligence umožňuje lidem rozvíjet své silné stránky a zdokonalovat své slabiny. Navíc zdůrazňuje, že inteligence nezávisí na vzdělání ani na socioekonomickém statusu a že každý jedinec má své vlastní jedinečné schopnosti a talenty.
V kontextu strojového učení je korpus velké množství textů ve formě například knih, článků, receptů, příspěvků na sociálních sítích… až po hlasové záznamy.
Korpusy slouží pro trénování jazykových modelů strojového učení, jako je například ChatGPT. S nadsázkou lze říci, že volba korpusu určuje, jaké názory bude model papouškovat.
Produktem strojového učení je model. K naučení modelu vždy potřebujeme data. Pod pojmem data si můžeme představit například tabulku, složku obrázků nebo textů. Pro jednoduché modely nám stačí několik desítek datových vzorků. Složitější modely, například neuronové sítě, jsou běžně trénovány i na tabulkách s miliony řádků.
Své poznatky naučený model po natrénování využívá k rozpoznávání nebo vytváření nových dat.
Existuje mnoho typů modelů strojového učení, které se používají k řešení různých úloh. Například pro rozpoznávání obrazu nebo hlasu, analýzu dat nebo generování obrazů (Midjourney) či textů (ChatGPT).
Technologie, která umělé inteligenci umožňuje poznávat a zařazovat objekty ve světě kolem nás. Pokud systémům rozpoznávání obrazu poskytneme data, mohou se podle nich naučit rozpoznávat cokoliv, od osob přes známé orientační body až třeba po domácí mazlíčky.
Počítačovým viděním se dnes můžeme přihlásit do mobilu ukázáním svého obličeje (Face ID), měřit vzdálenosti a hledat informace o objektech, které ani neumíme pojmenovat (Google Lens), nebo AI můžeme vzít třeba do lesa (BirdNET).
Díky přesnému rozpoznávání dopravních značek, jízdních pruhů a překážek na cestě dospívá také technologie samořiditelných aut.
Špatně připravená data nebo jejich nedostatek mohou způsobit, že umělá inteligence bude určitým způsobem předpojatá.
Pokud například budeme chtít, aby se umělá inteligence naučila rozpoznávat boty, ale budeme jí ukazovat výhradně obrázky tenisek, nebude boty na vysokém podpatku, sandály ani kozačky za boty považovat.
Aby systémy umělé inteligence byly etické a riziko zkreslení co nejnižší, programátoři a programátorky je v tomto duchu neustále ladí a jejich data pečlivě posuzují. To je jediný způsob, jak zajistit, aby systémy dobře pracovaly pro každého.
Více na: aidetem.cz/predpojatost
Stejně jako se člověk umí učit ze zkušeností, jsou toho schopny i člověkem vytvořené stroje. A stejně jako my lidé, tak i stroje k tomu potřebují data (a zkušenosti).
Stroje k učení využívají metodu, která se nazývá strojové učení. Ta umožňuje systémům umělé inteligence, aby nebyly jen souborem předem naprogramovaných akcí, ale aby samy přicházely s novými řešeními.
Cílem metod strojového učení je odhalit vzory vyskytující se ve velkém množství dat.
Více na: aidetem.cz/strojove-uceni
V moderní, internetem propojené, společnosti nachází umělá inteligence svá uplatnění na mnoha místech. S AI a jejími rozhodnutími se dnes potkáme v práci, na nákupech i ve volném čase. Poradí nám nejkratší nebo nejekologičtější cestu, rozpozná rostlinu, doporučí obsah na sociálních sítích, hudbu nebo film, přeloží text, vygeneruje nebo vyhledá obrázek, rozpozná anomálie na rentgenových snímcích, zahraje si s námi hru, popovídáme si s ní nebo nás třeba někam doveze autem.
Více na: aidetem.cz/vyuziti-ai
Velký jazykový model (jako například GPT-3) je sofistikovaný počítačový program, který je určen ke zpracování a modelování textu. Může být využit například pro strojový překlad, rozpoznávání řeči, generování odpovědí na otázky, či syntézu literálního díla.
Tyto modely jsou trénovány na obrovských objemech dat (tzv. korpusech) — například na datech získaných z internetu (Common Crawl), digitalizovaných knihách nebo Wikipedii.
Na světě je jich jen několik a jsou z důvodů nároků na počítačový hardware vytvářeny jen velkými společnostmi. V současnosti jsou nejznámější GPT-3 (OpenAI), Megatron-Turing (Microsoft a Nvidia), LaMDA (DeepMind) nebo Llama (Meta).
Proces vzniku velkého jazykového modelu může být (velmi zjednodušeně) rozdělen do tří kroků:
— výběr korpusů: ty by měly být dostatečně velké a rozmanité,
— trénování modelu: model je trénován na datech pomocí algoritmů strojového učení,
— validace a testování: model je zkoušen na datech mimo trénovací sadu, upravován a dále vylepšován.
Nakonec je model nasazen pro reálné použití, například pro vedení konverzace (chatboti), překlad textů nebo jiné aplikace. K tomu je třeba zajistit, aby se chatbot dobře choval k uživatelům a nikomu neublížil.