Prije samo nekoliko mjeseci, ako ste htjeli stvoriti sliku nečega, morali ste moći skicirati, slikati ili koristiti jedan od alata za fotošoping o kojima drugi stalno pričaju. Međutim, nakon 2022. sve se promijenilo, sve zahvaljujući umjetnoj inteligenciji — da, kao u "umjetnoj inteligenciji".
Umjesto da pokušavaju dominirati svijetom, umjetnički nastrojeni AI alati mogu sve što im opišete pretvoriti u sliku.
Pođite s nama dok ulazimo u svijet vizualizacije teksta pokretane umjetnom inteligencijom i pogledajte kako možete koristiti takve alate za pretvaranje svojih misli u stvarne slike jednostavnim upisivanjem onoga što imate na umu.
Dall-E: Umjetnička strana OpenAI-jevog GPT-3
Prvi alati pokretani umjetnom inteligencijom koji su postali popularni bili su temeljeni na OpenAI-jevom GPT-3. Jedan od razloga bila je otvorenost projekta vanjskom pristupu, što je dovelo do nekih prijedloga da GPT-3 je budućnost kreativnog rada.
Danas možete koristiti službene alate koje možete pronaći na OpenAI beta stranica
ili rješenja trećih strana koja iskorištavaju njegove lingvističke supermoći. Na primjer, možete zamoliti GPT-3 da osmisli nacrt za post, odgovori na jednostavna pitanja ili čak revidira ili prevede neki tekst.Godine 2022. OpenAI je otkrio da je GPT-3 jednako dobar u izradi slika. Projekt DALL-E, igra na Pixarov film WALL-E i Dalijevo ime, koristi GPT-3 ne za rad s tekstom, već kao mehanizam za izradu slika.
Baš kao s GPT-3 i tekstom, DALL-E nije baš kreativni genij, materijalizirajući slike iz ničega. Umjesto toga, "uvježban" je na milijunima slika koje već postoje na internetu. Njegove AI moći leže u analizi tih slika, uzimanju elemenata iz njih, dotjerivanju, preoblikovanju, prilagođavanju i konačnom njihovom kombiniranju u nove slike.
Barem je to pojednostavljena verzija onoga što se događa u pozadini. Većini ljudi bit će stalo samo do onoga što vide ispred sebe, a to je tekstni okvir u koji možete nešto upisati i vidjeti kako se to nakon nekoliko minuta pretvara u sliku.
Googleov Imagen odgovor
Google je jedan od tri najbolja "igrača" u istraživanju umjetne inteligencije. Ipak, njihov napredak nije lako uočljiv, niti su njegove implementacije u proizvode tako dostupne kao OpenAI-jeva ponuda.
Jedna od prvih Google AI široko dostupnih implementacija bila je u Google dokumentima i Gmailu, u obliku inteligentnijeg automatskog dovršavanja i prijedloga, poznatog kao Smart Compose. Nećemo ulaziti u pojedinosti budući da smo već pokrili Pametno sastavljanje (i kako ga možete koristiti).
Kada su te značajke aktivne, Googleove web aplikacije uspoređuju ono što korisnik upisuje s onim što su milijuni drugih napisali u prošlosti. Zatim predlaže što su upisali nakon toga.
To je dokaz da unatoč tome što želimo vjerovati, nismo toliko različiti. Ako 99 od 100 ljudi nakon "vidimo se" upiše "kasnije", vjerojatno bismo i mi to tipkali.
Svi smo koristili neki oblik automatskog dovršavanja, čak i iz T9 prediktivnog tekstualnog sustava iz ere "dumbphone". Zato se Googleovi AI alati nisu činili tako inteligentnima kao OpenAI-jev GPT-3. Nisu se činili toliko korištenijim od boljeg sustava T9 poboljšanog za 21. stoljeće. I zato je Imagenovo otkriće bilo pomalo šokantno.
Poput DALL-E na steroidima, Imagen je alat za vizualizaciju teksta. Na temelju onoga što je danas dostupno, Imagen može proizvesti "čišće" i živopisnije slike dok također zna kako se nositi s naprednim značajkama poput difuzije i transparentnosti.
Nažalost, u vrijeme pisanja ovog članka, pristup Imagenu je i dalje ograničen, pa ga nismo mogli isprobati.
DALL-E Mini i prijatelji: otvoreni za posao
Još ne možete slobodno pristupiti DALL-E i Imagenu. Ipak, mnoge su alternative već dostupne ako se želite zafrkavati s generiranjem tekstualne slike pomoću umjetne inteligencije.
Imajući na umu da su ovo rani dani i da rezultati ili korisničko iskustvo koje nude mogu biti daleko od optimalnih, ipak vrijedi provjeriti nešto od sljedećeg.
Izrada memeova s Dall-E Mini
Zahvaljujući kombinaciji više nego primjerenih rezultata i korisničkog sučelja, ali što je još važnije, širokoj dostupnosti, DALL-E mini postao je jedan od najpopularnijih AI vizualizatora teksta.
Daleko od savršenih, ponekad rezultati DALL-E mini mogu biti apstraktniji nego što je planirano.
Drugi put možda neće uspjeti stvoriti ono što ste imali na umu, ali može biti prilično blizu.
Nakon eksplozije popularnosti, kreatori DALL-E mini-a preselili su ga u novi dom pod novim brendom. Sada možete pronaći najnoviju verziju DALL-E mini kao Bojica na vlastitoj stranici.
Korištenje Craiyona danas je jednostavno poput traženja postojeće slike na mreži. Možete posjetiti njegovu stranicu, upisati opis svoje slike u polje za tekst i pritisnuti Enter. Nakon nekog vremena vidjet ćete rezultate na zaslonu.
Ono što je zapanjujuće je koliko su Craiyon i slični alati dobri u oponašanju vizualnih stilova. Na primjer, tražili smo da dočara slike psića na skejtbordu:
Zatim smo upotrijebili točnu frazu, ali smo nakon nje dodali "Pixarov stil". Nakon nekog vremena, Craiyon je pokazao mrežu više "crtanih" slika, bliže onome što doživljavamo kao Pixarovu grafiku praćenu zrakama u njihovim voljenim filmovima.
Craiyon nam je dao još bolje rezultate kada smo zamijenili "Pixar style" s "anime style" u istom upitu.
Anime je više stiliziran u svom izgledu od Pixarovih realističnijih slika, što je izgleda pomoglo Craiyonu da proizvede neke slike gotovo spremne za korištenje.
Zajebancija s latentnom difuzijom
Model latentne difuzije obučen na skupu podataka LAION-400M još je jedan zanimljiv AI vizualizator teksta. Međutim, to je također kompliciranije u njegovoj upotrebi. Morate ga pokrenuti online u virtualnom stroju i igrati se s njegovim različitim parametrima umjesto da samo upisujete u tekstualno polje. Ipak, lakše je nego što zvuči.
- Posjetiti Prostor za suradnju Google Latent Diffusion to je trenutno njegov dom.
- Pomaknite se malo prema dolje i primijetite Potaknuti polje pod Parametri. Zamijenite zadani upit onim što želite da vaša slika prikazuje.
- Odaberite Pokreni sve od Runtime izbornik ili pritisnite CTRL + F9.
- Ako želite moći izvesti proizvedene slike izravno iz alata, odgovorite pozitivno na pitanje želite li ga povezati sa svojim Google Drive računom. Alatu treba neko vrijeme da dovrši konfiguraciju i treba preuzeti neke datoteke tijekom procesa.
Povećanje vrijednosti za Koraci, Ponavljanja, i Uzorci_u_paraleli, može dovesti do detaljnijih rezultata. Međutim, alat je iznimno zahtjevan u resursima na Googleovim poslužiteljima. Kao rezultat toga, može se srušiti ako previše povećate te vrijednosti ili proces stvaranja određene slike postane kompliciraniji od očekivanog.
Zanimljive alternative
Proveli smo dosta vremena testirajući DALL-E mini i Latent Diffusion. Naša znanstvena metoda sastojala se od dva različita dijela. Prvo smo morali osmisliti koncepte koji bi se mogli točno opisati kao ludi. Zatim zamolite te AI vizualizatore da ih pretvore u slike. Češće nego što se očekivalo, uspjeli su, približivši se općoj postavi koju smo zamislili.
Također smo isprobali neke od dostupnih alternativa za ovaj članak. Još uvijek čekamo pristup drugima. Neki od onih koje vrijedi provjeriti su (bez posebnog redoslijeda):
- Sredina putovanja
- MindsEye beta
- ZvjezdaniAI
- San
- Disco difuzija
Hoće li umjetnost generirana umjetnom inteligencijom zamijeniti vizualnu umjetnost?
Obilje i stalno rastuća popularnost alata za generiranje slika koje pokreće AI navodi mnoge na zaključak da će vizualna umjetnost uskoro umrijeti. Koja je svrha ulaganja vremena i energije u učenje crtanja ili korištenje kompliciranog softvera za vizualizaciju stvari kada umjetna inteligencija to može učiniti brže (i uskoro bolje) od vas?
Ako ste primijetili, svi su ti alati "uvježbani na skupovima podataka". Na jednostavnom engleskom, to znači da oni rade ono što rade zahvaljujući tome što su ljudi već radili istu stvar prije.
To je nagovještaj zašto ti alati ne mogu zamijeniti ljudsku umjetnost, kreativnost i domišljatost. Oni su oponašatelji, pametni replikatori. Bez originala koje su izradili ljudi na kojima su obučeni, ne bi mogli proizvesti nikakve rezultate.
Ipak, to je sada, a priznajemo da ne znamo što budućnost nosi. Za sada vizualni umjetnici mogu mirno spavati. Ipak, brzinom kojom se umjetna inteligencija razvija, mnogi stručnjaci za ovu temu slažu se da nije pitanje hoće li ona ikada uistinu zamijeniti rad ljudi poput vašeg. Samo je pitanje kada.
Ali hej, nije sve u propasti. Dok se Skynet sprema preuzeti naše poslove, barem si možemo uljepšati raspoloženje stvarajući bez napora slike psića na skateboardu!