Umjetna inteligencija – što je to ustvari?
AI (artificial intelligence) tj. umjetna inteligencija je skup algoritama koji se odvija na računalu pokušavajući simulirati ljudsku inteligenciju – kao što su sposobnost učenja, razmišljanja i rješavanja problema.
Mala digresija prije samog teksta – ne da ti se čitati? Nema problema – snimih i fotkast epizodu vezano uz ovo:
No, da nastavimo s tekstom…
Konkretno što se tiče fotografije, postoji više različitih specijaliziranih algoritama u smjeru umjetne inteligencije, no najčešći danas su:
- generiranje fotografija putem unosa opisa
- generiranje lica koja ne postoje, no spoj su naučenih značajki iz velikog broja fotografija lica
- retuširanje starih i oštećenih fotografija (kreiranje dijelova na osnovu pretpostavki kako bi fotografija trebala izgledati)
- retuširanje u smjeru uljepšavanja fotografije po parametrima
- pomoćni alati u smjeru obrade fotografija
- umjetna inteligencija na fotoaparatima
Umjetna inteligencija i generiranje fotografija
Trenutno tri najpoznatija engine-a za generiranje fotografija kroz opis su:
Kroz njih je moguće u potpunosti izgenerirati izmišljenu fotografiju na osnovu prompta – opisa što se želi kreirati. Samo postavljanje prompta je ovisno o svakom određenom engine-u no osnove su svugdje iste. Svejedno, drugačije je od samog opisivanja prema osobi ili ono što je većina nas naučila do sad u interakciji s računalima: pisanjem upita za pretraživanje.
Pisanje promptova je stoga stvar koju je potrebno naučiti i izgleda kao vrlo interesantan posao budućnosti.
No, kako to ustvari izgleda?
Uz jednostavan prompt (za sad podržano samo na engleskom) postavljeno je da se izgenerira fotografija dvoje ljudi koji se rukuju u uredskom okruženju:
-
-
Stable Diffusion – test generiranje fotografije uz pomoć umjetne inteligencije
-
-
Midjourney – test generiranje fotografije uz pomoć umjetne inteligencije
-
-
DALL-E2 – test generiranje fotografije uz pomoć umjetne inteligencije
PROMPT:
two business people shaking hands satisfied in an office, male and female, caucasian, photography, photo, hyperrealistic, photorealistic
Generiranje lica koja ne postoje
Ispočetka relativno zanimljiva igračka, no u međuvremenu je ovo postao poprilično opasan alat jer ustvari služi i za kreiranje lažnih profila koje je teško provjeriti budući da lica izgledaju tako realno, a teško ih je usporediti s postojećim fotografijama.
Radi na principu dva suprostavljena algoritma umjetne inteligencije: jedan koji na osnovu naučenih značajki ljudskog lica iz nebrojenog broja fotografija s interneta pokuša izgenerirati realnu fotografiju (nepostojećeg) lica te drugi – koji pokuša iz lica shvatiti je li riječ o pravom ili generiranom licu. I, iako ovo izgleda relativno jednostavno ,da bi mi kao ljudi koji smo svakodnevno u interakciji s ljudima te kojima je život nekad ovisio o ovoj vještini, postotak prepoznavanja čak i ljudi koji su prešli obuku kako detektirati generirana lica je poražavajuć: otprilike 50% je maksimalna šansa da će se prepoznati da li se radi o pravom ili lažnom (tj. generiranom uz pomoć AI-a) licu kad to pokuša čovjek.
Jedan od prvih alata dostupnih na webu koji služi generiraju lica uz pomoć umjetne inteligencije je
ThisPersonDoesNotExist (svaki refresh stranice daje novo lice) – i, koliko god u međuvremenu ima drugih koji upotrebljavaju i dodatne podatke za unos, i dalje daje poprilično dobre rezultate.
Retuširanje starih i oštećenih fotografija
Jedan od poslova koji inače zahtijeva dosta ručnog rada na obradi fotografije je svakako dobijanje detalja tamo gdje nisu dostupni – jer su, najčešće kroz vrijeme, jednostavno nestali ti dijelovi a ponekad je i teško pretpostaviti o čemu se radilo.
I, dok je ovo do sad bilo uglavnom moguće riješiti uz rad umjetnika – umjetna inteligencija daje rješenje. GFP-GAN algoritam omogućava da se nadomjeste nepostojeći dijelovi, kao i uklone u potpunosti nepravilnosti i nedostaci starih fotografija.
Demo verziju je moguće isprobati ovdje.
U primjeru je isproban sken dagerotipije Edgara Allana Poe-a koji je fotografiran od strane W.S. Hartshorna 1848. (javno dobro – public domain). Iako su rezultati dosta suptilni, pri većem povećanju se vide dosta razlike – a mora se napomenuti i da je ovo napravljeno samo u par sekundi na neoptimiziranom algoritmu na javno dostupnoj web stranici!
-
-
Edgar Allan Poe – W.S.Hartshorn, 1848; public domain
-
-
GFP-GAN retuširanje – Edgar Allan Poe – W.S.Hartshorn, 1848; public domain
Retuširanje u smjeru uljepšavanja fotografija (lica)
Još jedna vrlo česta upotreba retuširanja fotografija je u smjeru uljepšavanja lica – što je postalo dostupno svima uz pomoć alata na samim mobilnim telefonima, većinom u sklopu aplikacija društvenih mreža pod nazivom “filtri”. I, dok je rezultat većine ovih alata relativno lako prepoznati budući da su namijenjeni za male rezolucije kako bi se smanjila potreba za procesiranjem budući da se ionako neće gledati na većim ekranima, LENSA (
LENSA na Google Play-u /
LENSA na App Store-u ) kao primjer alata iz ove skupine je poprilično sofisticiranije prirode.
Lice, ali i cjelokupnu scenu je moguće izmjeniti prema velikom broju parametara – od zaglađivanja kože, smanjivanja nosa, jagodica, povećanja očiju, povećanja usnica (također i frizure, no još uvijek se izgleda ne snalazi najbolje s bradom) te na taj način napraviti u vrlo kratkom vremenu poprilične izmjene na fotografiji. Umjetna inteligencija svakako pomaže da se zadrži doza realnosti u ovoj upotrebi iako se stvarno može zaigrati poprilično s ovime.
-
-
Darko Mareš
-
-
Umjetna inteligencija – Darko Mareš / Processed with Lensa with Magic Correction
AI – ostali alati u službi obrade fotografije
Uz ove, poprilično općenite alate koji služe za poboljšati cijelu fotografiju, postoji i više specijaliziranih alata koji su prisutni u programima za obradu fotografija, te izgleda da za sad Adobe Photoshop vodi po broju stvari koje je moguće vidjeti direktno unutar upotrebe:
- content aware fill
- sky replacement
- neural filters
- selection / refine select
No, osim ovih, i naizgled jednostavni programi poput native aplikacije Photos na iphonu (IOS 16+) već posjeduje djelomično upotrebu algoritama umjetne inteligencije – omogućavajući odvajanja osobe iz pozadine samo uz pomoć povlačenja prstom po ekranu!
Umjetna inteligencija na fotoaparatima
Da ne bi bilo da je AI samo za obradu fotografija – tehnologija je već poprilično prisutna i na samim fotoaparatima – bilo da je riječ o čitanju svjetla na sceni ili nečeg kompliciranijeg: poput traženja oka u sceni kako bi se automatski našla točka fokusa… čisto da se ne moraš zamarati i fokusiranjem, kao naravno i pretpostavljanjem koliko je sve ustvari osvjetljeno.
Za sad je sve ovo relativno mala pomoć… no, samo pričekajmo kuda će nas sve ovo odvesti…