Generování obrazů pomocí AI
Generativní modely umožňují vytvářet obrazy na základě textových zadání (tzv. promptů), obrázků nebo jiných vstupů. Uživatel například textově popíše svou představu a AI následně vytvoří odpovídající obraz. V současnosti se nejčastěji využívají především difuzní modely, které dominují moderním nástrojům pro generování obrazů.
Difuzní modely
Difuzní modely fungují tak, že se během tréninku do obrázků postupně přidává šum a model se učí tento šum odstraňovat. Při generování nového obrazu pak AI postupně „čistí“ náhodný šum, až z něj vytvoří výsledný obraz odpovídající zadání uživatele.
GAN — Generativní adversariální sítě
GANy využívají dvě neuronové sítě — generátor a diskriminátor. Generátor vytváří nové obrazy a diskriminátor hodnotí, zda vypadají realisticky. Obě sítě se společně učí a postupně se zlepšují. GANy byly velmi důležité pro rozvoj generativní AI, dnes se ale pro běžné generování obrazů používají méně často než difuzní modely.
Moderní generativní AI dnes často kombinuje více technologií a umožňuje nejen vytváření nových obrazů, ale také jejich úpravy, stylizaci, doplňování chybějících částí nebo generování videa.