AI obrázky. Velké téma dnešních dní. Pro někoho forma umění, pro jiné chudá kopie práce opravdových umělců. Toto kontroverzní téma třese již přes rok internetem. Ale ač mnozí považují AI umění za zlo, je jen těžko popiratelné, jak daleko se právě generování obrázků posunulo. V dnešních dnech již máme mnoho různých programů a AI algoritmů generujících různorodé obrázky různorodé kvality. V dnešním článku se právě na onu kvalitu zaměříme.
Trocha historie
Píše se rok 1957. Sovětský vesmírný vývoj za poslední roky prošel zásadním vývojem a SKP je připraveno, v rámci svého závodu s Americkou NASA, získat další velký úspěch. Vyslání prvního živého tvora do kosmu. Jedná se o fenku Lajku, která se nalodí na plavidlo Sputnik 2, v němž odletí směrem ke hvězdám. A 3.11. se tak opravdu stane. Lajka, oblečená v úhledné vesmírné uniformě na palubě drobného plavidla Sputnik 2, vystoupá jako první živý tvor pocházející z planety Země na oběžnou dráhu. Lajka se stala hrdinkou celého lidstva i psího pokolení. Její mise však naneštěstí skončila pro našeho psího hrdinu tragédií. Lajka se na zemi živá již nevrátila.
Poskočíme o pouhých 12 let vpřed do roku 1969, tentokrát do USA. Dne 16.7. odlétá z Americké půdy raketa, která změní dějiny. Oběžné dráhy dosahuje za 12 minut a o 4 dny později, 20.7., dosedá na povrch měsíce. Jedná se o raketu Apollo 11, na jejíž palubě se nachází posádka všem dobře známých mužů. Velitele Neila Armstronga, pilota lunárního modulu Edwina Aldrina a pilota velitelského modulu Michaela Collinse.
Apollo 11 se vrátilo zpět na Zemi 24.7. stejného roku, přinášeje zpět nejen živou posádku, ale také mnoho vzorků hornin a fotografií měsíce. Slovy samotného Armstronga, „Toto je malý krok pro člověka, ale velký krok pro lidstvo.“ Co na to ale psi? Jejich poslední kosmonautka se dostala pouze na oběžnou dráhu, a dokonce se ani nevrátila živá. Díky AI tohoto však právě dnes můžeme dosáhnout, a dát psímu pokolení také možnost dotknout se povrchu měsíce, abychom napravili tuto nespravedlnost. Tedy alespoň digitálně. Nechť tedy započne naše velká psí cesta na měsíc!
Testování AI generování obrázků
Skočme nyní zpět do roku 2024 a podívejme se na to, co budeme testovat. Dnešní test se zaměří na velké a populární programy na generování obrázků. Nebude se však zaměřovat pouze na výsledky, ale i na příjemnost jejich užití a případné nacenění. Našimi subjekty budou Dall-e 3.0, Midjurney, Microsoft Designer, Leonardo.ai, Ideogram a v neposlední řadě Canva.
Testování generování vyžaduje primárně dobrý „prompt“, neboli text, který do modulu prvotně vložíme. Jelikož většina AI operuje primárně v angličtině a poskytne tak nejlepší výsledky právě v tomto jazyce, bude samotný prompt anglicky. Náš psí příběh započne promptem:
„Generate me an image of a dog in an astronaut suit on the surface of the moon overlooking planet Earth in the distance. Next to the dog, there should be a brown flag with a bone symbol on it and also a rocket similar to Apollo 11.“
(Vygeneruj mi obrázek psa v astronautském obleku na povrchu měsíce sledujícího planetu Zemi v dáli. Vedle psa by měla být hledá vlajka se symbolem kosti a raketa podobná Apollu 11.)
Stran generování samotného necháme AI pouze jeden pokus. Většina umělé inteligence generující obrázky vygeneruje 4 různé naráz. Ve článku bude vložen pouze nejlepší z výsledků. A nyní už, bez dalšího zdržování, vzhůru na psí expedici ke hvězdám.
Dall-E 3.0
• Placený program (spadá pod ChatGPT subscription)
• Dostupný přímo na stránkách ChatGPT
• Velmi jednoduché a intuitivní používání
• Lze nalézt mnoho jiných stránek implementujících jeho technologii
Dall-E 3.0 vyvíjené společností OpenAI je v dnešní době z velké části jistotou pokud jde o generování obrázků. Pro profesionálnější užití se jedná o optimální volbu, spojující efektivnost a kvalitu. Je však dobré podotknout, že nejvyšší kvality dosáhne pouze enterprise uživatel. Prostý uživatel sahá na osekanější verzi tohotéž modelu poskytující slabší výsledky. Potřeba placení je navíc obecně pro mnohé překážkou. Existuje však mnoho stránek, které služby Dall-E 3 v limitovaném rozsahu a méně kvalitní nabízejí také.
Dall-E se popasovalo s naším psím hrdinou ve víceméně realistickém vyobrazení. Samotný pes je zpracován v rozumné kvalitě. Neobjevuje se zde pro AI typické artefaktování očí a má i správné množství prstů na končetinách. Kde se však problém očividně nachází jsou texty, které se AI pokusilo do obrázku implementovat. Ty jsou absolutně nepoužitelné. Toto je však neduh většiny dnešních AI modelů generujících obrázky. Stran dodatků zde máme sice planetu Zemi v pozadí, ale Dall-E kompletně odignorovalo požadavek pro zakomponování rakety a na vlajku místo kosti dalo psa. Vzhledem k tomu, že Dall-E generuje pouze 1 obrázek na prompt, držím se mnou nastavených pravidel a další šanci mu již nedávám.
Hodnocení:
+ Kvalita samotného psa
+ Téměř nulové artefaktování
+ Rozumně vypadající oblečení (až na nejasný přechod u tlapek)
+ Planeta země v pozadí
– Texty v obrázku jsou nesmyslné
– AI nevložilo 2 z požadavků
Celkové hodnocení: 4/10
Midjurney
• Přístup převážně přes Discord díky příkazům
• Zvláštně nastavené nacenění ve 4 různých programech poskytujících limitované funkce
Midjurney je na trhu již dost dlouhou dobu. Přišlo nedlouho po první iteraci Dall-E a za svou existenci prošlo již 6 různými modely. Co bylo na Midjurney vždy příjemné byla možnost jeho užití zdarma díky otevřené komunitě na Discordu, kde si uživatel mohl díky příkazům generovat obrázky. Kvůli masivnímu vytížení, které Midjurney nyní zažívá, je však tato zkušební verze vypnutá pro nové uživatele, a po půl roce v tomto stavu se zdá, že to tak pro bližší dobu i zůstane. Nacenění Midjurney je pak relativně zvláštní. Vzhledem k jejich zaměření převážně na profesionální tvůrce a firmy má Midjurney 4 kategorie poskytující různé subkategorie jejich produktu. Jejich implementace je pak primárně pro vložení do většího kódu nebo hromadné generování. Pro uživatele je tak relevantní asi pouze nejlevnější úroveň Midjurney za 8 euro, která je však velmi limitovaná a neposkytuje ani primární přístup ke službě při přeplnění.
Stran kvality Midjurney ukazuje proč je jednou z jendiček trhu. Nejen že vložilo vše, co jsme po něm požadovali, ale až na chybnou implementaci psí hlavy procházející hledím helmy neudělalo zásadní chybu v celém produktu. Je diskutabilní, zda by pes na měsíci stál na zadních tlapkách či na všech čtyřech, ale nebereme-li v potaz tuto drobnou nuanci, nabízí Midjurney velmi slušný výsledek.
Hodnocení:
+ Implementace všech komponentů
+ Korektní pojetí vlajky, rakety i Země v pozadí
+ Detailování astronauta pro podpoření idey psa (ocas vykukující vzadu)
– Psí hlava procházející hledím helmy
– Nekorektní póza psa
Celkové hodnocení: 6/10
Microsoft Designer
• Součást Microsoft Copilot
• Dostupné pouze v prohlížeči Edge nebo aplikaci Bing pro telefony
• Kompletně zdarma pro neomezené generování
• Rozsáhlé možnosti úpravy i po prvním generování s intuitivním užitím
Microsoft Designer spadající pod Copilot je až překvapivě kompetentní generátor AI obrázků. Jeho užití je kompletně zdarma a jeho výsledky, ač ne vždy napoprvé, jsou dosti kvalitní. Velká výhoda fungování Microsoft Designer je jeho blízké propojení s AI modelem Copilot dovolující mu extenzivnější komunikaci s uživatelem a užití navazujících požadavků pro úpravu prvotního promptu bez potřeby neustálého přepisu.
Designer využil v generování našeho psího astronauta svou největší sílu. Kresby. V nich značně exceluje oproti jiným stylům generování. Povedlo se mu také implementovat veškeré požadované věci, a to v poměrně oku libém stylu. Rozhodně se zde však objevují pro Designer klasické problémy. Prvním z nich je duplikát Země v pozadí, a druhým je nesmyslný zartefaktovaný přístroj napravo od psa. Samotný pes je však zpracován velmi obstojně.
Hodnocení:
+ Vysoká kvalita psa
+ Dobrá implementace všech požadavků
+ Dodatečné detaily podporující ideu vesmíru
– Dvě planety země
– Artefaktování
Celkové hodnocení: 8/10
Leonardo.AI
•Použitelný zdarma s limitem kreditů
• Moře možností pro každé generování (některé skryté za placenou verzí)
• Škála různých funkcí umožňující také modifikaci obrázků
Co se Leonardo.AI týče, je těžké vůbec nalézt kde začít. Škála funkcí nabízená touto stránkou je skutečně absurdně enormní, nabízeje prakticky neomezenou možnost uživatelského nastavení. Pro účely testování jsem zanechal nastavení ve výchozím stavu, tedy tak, jak se Leonardo nastaví po prvním spuštění. S každým modelem bych však samozřejmě dosáhl úplně jiného výsledku, a je tedy vhodné brát toto hodnocení jako hodnocení pouze části celého Leonardo.AI.
Zvolený realistický model si poradil s naším psím astronautem na obstojné úrovni. Poprvé máme psa v helmě, což je rozhodně vhodné ocenit, neboť generování objektů za sklem pro AI není vůbec jednoduché. Dokonce dostal pes na své tlapky i rukavice. Kde však Leonardo ztrácí jsou detaily pozadí. Prvním nedostatkem je fakt, že planeta Země je ve tvaru vejce, implikujíc nadvládu slepic v této alternativní realitě psích astronautů. Dále tu, podobně jako u Dall-E, nemáme ani vlajku ani raketu.
Hodnocení:
+ Skvěle zpracovaný psí astronaut
+ Nulové artefaktování
– Planeta Země je ve tvaru vejce
– AI nevložilo 2 z požadavků
Celkové hodnocení: 7/10
Ideogram
• Použití zdarma pod podmínkou minutového čekání mezi generováním
• Poměrně pomalé generování samotných obrázků
• Jednoduchá funkcionalita bez rozsáhlého množství nastavení
Ideogram je velmi jednoduchým programem. Uživatel vloží text, ideogram vyplivne obrázek. Toť vše. Žádné složité nastavování, žádné doplňování promptů po prvotní generaci, a obecně žádné komplikace. Stran kvality je pak Ideogram velmi nekonzistentní. Při zadání promptu mi vygeneroval 4 obrázky. 2 z nich byly absolutně otřesné, 1 byl průměrný, a poslední z nich jsem vybral pro reprezentaci.
Co se povedlo Ideogramu mě samotného překvapilo. Obrázek ve stylu ilustrace, který Ideogram vygeneroval, nemá prakticky žádnou chybu a byl by krásnou ilustrací například dětské knihy. Nulové artefaktování, krásná vlajka, výborně zpracovaný pes, planeta v pozadí, jednoduše excelentní práce. Jedinou drobnou výtku bych snad dal za velikost rakety, ale vzhledem ke stylu ilustrace nekladu rozměrům váhu.
Hodnocení:
+ Nádherný psí astronaut
+ Veškeré detaily které byly požadovány
+ Konzistentní rozkošný vizuální styl
– Velikost rakety
Celkové hodnocení: 10/10
Canva
• Poměrně univerzální program sloužící jako alternativa Photoshopu
• Limitované použití zdarma s poměrně drahou pro verzí
• Prostředí na mě působí trochu lacině, ale je funkční
Canva není tolik program zaměřený na generování obrázků jako spíše program zaměřený na AI úpravu obrázků s dodatečnou možností generování. Jejich model je však poměrně potentní a dokáže vytvářet obstojné výsledky za velmi krátkou dobu. Možnost dalších úprav ve stejném prostředí s širokou škálou možností pak dělá z AI generování velmi dobrý dodatek k celé Canvě.
Stran samotného psího astronauta je zde však mnoho problémů. Canva má, z mých zkušeností, obecně poměrně problém s přehlazováním obrázků. Psí srst tak místy vypadá spíše jako modelovací hlína. Vlajka a symbol na uniformě jsou pak také podivně nepřiléhavé a celá uniforma opět působí přehnaně vyhlazeně. Lze však ocenit skvěle implementované rukavice na tlapkách. Implementace vlajky je pak sice správná, ale styl vlajky je kompletně mimo a Canva se také rozhodla ignorovat požadavek na raketu. Planeta Země v pozadí je však implementována dobře.
Hodnocení:
+ Hezké pozadí
+ Psí čumák vypadá realisticky
+ Struktura uniformy
– Přehnané vyhlazení
– Chybějící raketa
– Vlajky
Celkové hodnocení: 5/10
Konec expedice
Šestice hrdinných psích astronautů se vydala do kosmu, šest jich také dosáhlo měsíce. A my viděli 6 různých AI modelů při práci. Jak to tedy celé dopadlo?
Bezkonkurenčně nejlépe se dařilo Ideogramu, který pojal úkol nejlépe a prakticky bez chyb. Velmi dobře si pak také vedl Microsoft Designer. Naopak velkým zklamáním byl plně placený a přesto nejvíce chybující Dall-E 3.0. A co si z toho všeho odnést? Každý AI model samozřejmě exceluje v něčem jiném, a s dostatkem trpělivosti, správným nastavením a dostatečnou expertízou se z každého z uvedených modelů dá vyprodukovat fascinující obrázek. Pro rychlé a prosté užití však rozhodně nemá smysl platit si za prémiové služby, obzvláště když služby zdarma nabízejí stejně kvalitní ne-li lepší výsledky.
PS:
Během psaní tohoto článku nebyl odeslán žádný pes do kosmu. Na PAP (Psí Astronomický Program) si budeme ještě muset počkat…
