Ovu animiranu mona lizu stvorio je AI i to je zastrašujuće

Pin
Send
Share
Send

Enigmatičan, naslikan osmijeh "Mona Lise" poznat je širom svijeta, ali to je poznato lice nedavno pokazalo zapanjujući novi raspon izraza, ljubaznošću umjetne inteligencije (AI).

U videozapisu koji je 21. svibnja podijeljen na YouTubeu, tri videoisječka prikazuju neskladne primjere Mona Lise dok pomiče usne i okreće glavu. Stvorila ga je konvolucionarna neuronska mreža - vrsta AI koja obrađuje informacije onoliko koliko ljudski mozak radi, da analizira i obrađuje slike.

Istraživači su obučili algoritam kako bi razumjeli opće oblike crta lica i kako se ponašaju jedan prema drugom, a zatim da primijene te informacije na fotografije. Rezultat je bio realan video slijed novih izraza lica iz jednog kadra.

Za videozapise Mona Lisa AI je "naučio" kretanje lica iz skupova podataka triju ljudskih subjekata, proizvodeći tri vrlo različite animacije. Iako je svaki od tri isječka i dalje bio prepoznatljiv kao Mona Lisa, varijacije u izgledima i ponašanju modela treninga usvojile su različite ličnosti „živim portretima“, Egor Zakharov, inženjer sa Instituta za znanost i tehnologiju u Školskom, i Samsung AI centar (oba se nalaze u Moskvi), objašnjeno je u videu.

Zakharov i njegovi kolege također su generirali animacije iz fotografija kulturnih ikona 20. stoljeća kao što su Albert Einstein, Marilyn Monroe i Salvador Dali. Istraživači su opisali svoja otkrića, koja nisu bila recenzirana, u studiji objavljenoj na mreži 20. svibnja u časopisu za tisak arXiv.

Poznata lica poprimaju nepoznate izraze. (Slika: E. Zakharov i dr.)

Izrada originalnih videozapisa poput ovih, poznatih kao deepfakes, nije lako. Ljudske glave su geometrijski složene i vrlo dinamične; 3D modeli glave imaju "nekoliko desetaka milijuna parametara", napisali su autori studije.

Nadalje, sustav ljudskog vida vrlo je dobar u prepoznavanju "čak manjih pogrešaka" u ljudskim glavama s 3D modelima, navodi se u studiji. Vidjeti nešto što izgleda gotovo ljudsko - ali ne baš - pokreće osjećaj duboke nelagode poznat kao efekt nebeske doline.

AI je prije pokazao da je moguće stvaranje uvjerljivih dubinskih zvukova, ali zahtijeva više uglova željenog predmeta. Za novu studiju, inženjeri su predstavili AI u vrlo velik niz referentnih videozapisa koji prikazuju ljudska lica u akciji. Znanstvenici su utvrdili orijentire na licu koje bi se odnosile na bilo koje lice kako bi naučili neuronsku mrežu kako se lica ponašaju općenito.

Zatim su uvježbali AI da koriste referentne izraze za mapiranje kretanja značajki izvora. To je omogućilo AI da stvori deepfake čak i kad ima samo jednu sliku na kojoj je mogao raditi, izvijestili su istraživači.

I više izvornih slika je dalo još detaljniji rezultat u finalnoj animaciji. Videozapisi stvoreni iz 32 slike, a ne samo jedne, postigli su "savršen realizam" u korisničkoj studiji, napisali su znanstvenici.

Pin
Send
Share
Send