Napišite sliku: AI koji stvaraju slike
AI alatima za stvaranje slika poput Midjourney i Dalle-e smo se u početku smijali. A onda su postali popularni i evoluirali. Šta su ovi alati, kako rade i kakva im je budućnost, pitali smo Radoslava Dejanovića, IT stručnjaka i novinara.
Piše: Radoslav Dejanović
Sigurno ste čuli za to: ChatGPT i
cijela vojska AI sustava koji znaju napraviti sliku, nacrtati nešto umjetničko,
ispričati novu priču ili sastaviti domaću zadaću... revolucionarna umjetna
inteligencija koja će pola čovječanstva učiniti nezapošljivim, a pisanje
lektire besmislenim trudom zaostalih profesora materinjeg jezika.
Demistificirajmo to. Ne, nećete ostati bez posla. I ne, djeco, žao mi je, i dalje ćete morati pisati lektiru.
Umjetna inteligencija je područje na
kojem znanstvenici i inženjeri rade već desetljećima: prvi ekvivalent onoga što
možemo smatrati umjetnom inteligencijom program je za igranje dame, a nastao je
1951. godine, dok je prvi AI program koji je u sebi imao mogućnost učenja na
osnovu odigranih partija načinjen 1955. godine.
Naravno, mogućnosti hardvera tog doba
ne možemo baš nikako uspoređivati s mogućnostima modernog hardvera, pa ti
programi koji se danas čine smiješno jednostavnim u svoje su doba predstavljale
senzaciju ravnu onoj koju su moderni AI programi izazvali u najnovije doba.
Jedan od prvih „kućnih“ AI programa
dostupnih svima bila je ELIZA, stvorena
1964. godine i kasnije dostupna za mnoga računala, uključujući i tada popularna
kućna 8-bitna računala. Taj program simulirao
je razgovor s psihoterapeutom koristeći jednostavan ali efektan
skup logičkih i semantičkih pravila, zbog čega se sugovornicima činilo kako
razgovaraju s živom osobom.
Moderna umjetna inteligencija zapravo
je samo značajno kompleksnija, time i uvjerljivija varijacija na već odavno
poznatu temu. Izniman napredak hardvera omogućio je visoku sofisticiranost nove
tehnologije, korištenje novih, boljih i bržih algoritama i eksperimentiranje s
novim matematičkim konceptima. Rezultat toga je pojava značajno „uvjerljivijih“
modela umjetne inteligencije koji se nama danas čine jednako čudesnima kao što
je ELIZA izgledala čudesno našim roditeljima, ali na kraju priče to je i dalje ELIZA
efekt.
Razvoj umjetne inteligencije ostavio
je traga na mnoštvu ljudskih aktivnosti, no često na nevidljiv, suptilan način:
američka FDA odobrila je već preko pet stotina različitih implementacija
umjetne inteligencije za različite namjene u medicinske svrhe, i ti se
algoritmi koriste u mnoštvu uređaja.
Čak i “obični ljudi“ imaju velike
koristi od umjetne inteligencije, iako obično niti ne znaju da je koriste:
svaki puta kada koristite „pametne mogućnosti“ softvera za, primjerice,
uređivanje slike, pa vam on uljepša ten, poštima boje i izreže sliku da lijepo
izgleda, ili pak obriše neki detalj sa slike koji vam baš smeta – taj posao
obavlja umjetna inteligencija.
Zato, ne treba paničariti: umjetna
inteligencija je već tu, vrlo je korisna za mnoge stvari, i neće dovesti do
sloma ekonomije i vala nezaposlenosti.
Jedno od žarišta umjetne inteligencije
je stvaranje slika, što je relativno nova AI pojava: još do prije par godina
slike koje su takvi sustavi stvarali bile su vrlo apstraktne i nedorečene;
fantastično brza evolucija ovih sustava dovela je do toga da danas umjetnici
otvoreno govore protiv umjetne inteligencije u strahu da će ostati bez posla.
Taj je strah ipak, barem zasad,
neosnovan: jednako kao i njihovi preci, moderni primjeri umjetne inteligencije,
ma koliko sofisticirani, i dalje nisu u stanju parirati ljudskom mozgu. Tako
slike napravljene pomoću umjetne inteligencije, ma koliko laicima dobro
izgledale, još uvijek imaju neke očite nedostatke. No, ne možemo poreći da su
računala danas u stanju proizvesti poprilično spektakularne uratke.
I, ono što je u toj priči
najzanimljivije: umjetna inteligencija otvorila je vrata ljudima koji nemaju
slikarskog dara u jedan novi kreativni svijet – i to je možda najveća dobrobit
ove tehnologije, to omogućavanje ljudima da se kreativno izražavaju na njima
posve novi način. Mnogi entuzijasti rado su uskočili u tu za njih novu
kreativnu nišu i rezultat su doslovce milijuni korisnika raznih verzija
softvera za stvaranje slika – u samo nekoliko mjeseci.
Ulazak u taj fantastičan novi svijet
kreativnosti gdje korisnik opisuje sliku koju zatim stvara računalo (što je
najjednostavnije objašnjenje svih tih popularnih novotarija) relativno je jednostavan,
jer korisnik može birati između mnoštva opcija: od relativno povoljnog rješenja
koje se pokreće na (malo jačem) kućnom računalu i ne košta ništa, do ne tako
povoljnog rješenja koje ne zahtjeva nikakvo lokalno računalo, već se sve
obavlja u oblaku – naravno, uz pretplatu.
Midjourney je jedan
od korifeja te moderne scene: riječ je o servisu koji slike stvara u oblaku, i
komercijalne je naravi. Nije jeftin, no kvalitetom slika i
jednostavnošću uporabe zasad daleko odskače
od svih sličnih rješenja. Upoznajmo se s njim.
Za korištenje Midjourney-a potrebno je
imati otvoren račun na servisu Discord
(besplatno) i, naravno, uplatiti mjesečnu ili godišnju pretplatu
na Midjourney servis, za što se dobiva određena količina procesorskog vremena
koje se troši na stvaranje novih slika.
Za lakše upravljanje korisno je (ali
ne i nužno) stvoriti vlastiti server na Discordu (besplatno) i u njega pozvati
Midjourney Bot kojemu potom zadajemo zapovjedi što želimo da stvori.
Korištenje je iznimno jednostavno: u
novostvorenom kanalu ili u direktnoj poruci botu jednostavno napišemo:
/imagine (i zatim na engleskom jeziku
opišemo što želimo da nam Midjourney naslika)
Nakon nekog vremena bot će nazad vratiti
četiri slike, četiri prijedloga kako MJ vidi vaš opis. Ispod njih biti će
četiri gumba za uvećanje željene slike (U1 – U4) ili za stvaranje nove četiri
varijacije na temu jedne od tih slika (V1 – V4). Gumb s ikonicom recikliranja
naložiti će botu da zatraži izradu četiri posve nove slike.
U praksi, to izgleda ovako:
U prvom redu nalazi se opis kojeg sam
poslao botu naredbom /imagine, a ispod toga nalaze se četiri slike koje je MJ
kreirao na osnovu mojeg opisa. Kako možete vidjeti, one su stilom različite, no
sve četiri se drže osnovne teme. Izabrati ćemo treću sliku po redu, i klikom na
gumb U3 ćemo je uvećati:
Impresivno, zar ne? No, pažljiviji
pogled na sliku otkriva nam kako je riječ o slici koju je stvorila umjetna
inteligencija: lijeva ruka ima sedam prstiju.
Razlog tome je jednostavan i posve
logičan: baš kao i baka ELIZA koja je bila samo lukavo složen program koji je
znao postaviti gramatički ispravna pitanja bazirana na korisnikovom unosu i
ništa više od toga, moderni programi za stvaranje slika jednako tako nisu ni
samosvjesni, ni inteligentni – oni su samo vrlo sofisticirani strojevi koji
uzimaju ulazni podatak od korisnika (opis), raščlanjuju ga na logičke dijelove
koje mogu strpati u kategorije, i potom na ekranu stvaraju naprosto statistički
značajne digitalne mrlje na digitalnom platnu: računalo u bilo kojem trenutku
nema svijest o tome što radi. Zbog toga stvara pogreške koje ljudski umjetnik
nikada ne bi počinio, a koje se vrlo često mogu otkriti naprosto pažljivim
promatranjem elemenata slike.
Naravno, napredak umjetne
inteligencije popeglati će i te nedostatke, no u ovom trenutku oni jasno pokazuju
ograničenja umjetne inteligencije i otkrivaju srž stvari: ma koliko slike koje
vam računalo napravi bile fantastične i izgledale maštovito, one su i dalje
samo reprodukcija nastala na osnovu hladnog, nemaštovitog matematičkog modela.
Otkud, pak, izvire ta nedvojbena
raznolikost i ponekad i hrabrost u prikazivanu slika? Ti sustavi nastali su
kompleksnim procesom treniranja umjetne inteligencije na ogromnom broju
stvarnih slika: popularni Stable Difussion (kojeg možete isprobati ovdje) treniran
je na 2.3
milijarde slika!
I tu dolazimo do etičkog problema: mnogi od tih alata koristili su za trening slike živućih autora bez njihova znanja ili privole, zbog čega je nastao mali skandal. Rezultat tog etičkog sukoba je svojevrstan kompromis, pa se novi modeli treniraju samo pomoću etički ispravno pribavljenih slika (tj. slika izvan domene važećeg autorskog prava). To je privremeno donekle umanjilo kvalitetu treniranih podataka javno dostupnih modela, no vrlo je vjerojatno da će i taj pad kvalitete biti prevaziđen u skoroj budućnosti.
Eto, to je ta budućnost koja je digla tako mnogo prašine. Svakako revolucionarna, svakako disruptivna, apsolutno fantastično zabavna, ali daleko od toga da će značiti kraj umjetnosti. Transformaciju zanata? Vrlo vjerojatno, no ne zaboravimo: umjetnici već neko vrijeme koriste umjetnu inteligenciju da si olakšaju posao – često toga nisu niti svjesni.
I, za kraj, sve gore navedeno vrijedi
i za ChatGPT: poigrajte se s njim malo ozbiljnije i primjetiti ćete kako
halucinira stvari – ali ih halucinira na vrlo uvjerljiv način. Jer je ChatGPT
zamišljen kao umjetna inteligencija koja zna osmisliti konverzaciju, a ne
stvarati logičke zaključke. Ili pisati zadaćnice umjesto vas.
Uostalom, već sutra sve će vaše
zadaćnice, eseji i lektire biti provjeravani na originalnost i plagiranje –
budnim digitalnim okom umjetne inteligencije.
Slike na ovom članku, osim naslovne, konstruirao je Radoslav Dejanović pomoću Midjourney.
Napomena: Radoslav je održati radionicu o kreativnoj upotrebi ovog alata u Samoboru. Više inormacija na ovom linku.
Primjedbe
Objavi komentar