ŠO ANIMĒTO MONU LIZA IZVEIDOJA AI, UN TAS IR DRAUSMĪGI

Send

Mona Lizas mīklainais, gleznotais smaids ir pazīstams visā pasaulē, taču šī slavenā seja nesen parādīja pārsteidzoši jaunu izteicienu klāstu, pateicoties mākslīgā intelekta (AI) pieklājībai.

Video, kas kopīgots vietnē YouTube 21. maijā, trīs videoklipi parāda nepatīkamus Monas Lizas piemērus, kad viņa kustina lūpas un pagriež galvu. Viņu izveidoja konvolūcijas neironu tīkls - tāda veida AI, kas apstrādā informāciju līdzīgi kā cilvēka smadzenes, lai analizētu un apstrādātu attēlus.

Pētnieki apmācīja algoritmu, lai izprastu sejas pazīmju vispārējās formas un to, kā viņi uzvedas viens pret otru, un pēc tam šo informāciju piemērotu nekustīgiem attēliem. Rezultāts bija reālistiska jauno sejas izteiksmju video secība no viena kadra.

Mona Lisa videoklipiem AI "iemācījās" sejas kustību no trīs cilvēku subjektu datu kopām, veidojot trīs ļoti atšķirīgas animācijas. Lai gan katrs no trim klipiem joprojām bija atpazīstams kā Mona Liza, mācību modeļa izskata un izturēšanās variācijas "dzīvajiem portretiem" piešķīra atšķirīgas "personības", "Skolkovo Zinātnes un tehnoloģijas institūta inženieris Egors Zaharovs un Samsung AI centrs (abi atrodas Maskavā), paskaidrots videoklipā.

Zakharovs un viņa kolēģi arī ģenerēja animācijas no tādu 20. gadsimta kultūras ikonu fotogrāfijām kā Alberts Einšteins, Marilina Monro un Salvadors Dalī. Pētnieki aprakstīja savus atklājumus, kuri netika salīdzināti, pētījumā, kas tiešsaistē publicēts 20. maija pirmsdrukas žurnālā arXiv.

Pazīstamās sejas uzņem nepazīstamus izteicienus. (Attēla kredīts: E. Zakharov et al.)

Šādi oriģinālu videoklipu, kas pazīstami kā dziļi fakesi, producēšana nav vienkārša. Cilvēka galvas ir ģeometriski sarežģītas un ļoti dinamiskas; Galvu 3D modeļiem ir "desmitiem miljonu parametru", pētījuma autori rakstīja.

Turklāt saskaņā ar pētījumu cilvēka redzes sistēma ļoti labi identificē "pat nelielas kļūdas" 3D modelētām cilvēku galvām. Ieraugot kaut ko, kas izskatās gandrīz cilvēciski, bet ne gluži,, tas izraisa dziļu nemieru, kas pazīstams kā nekaunīgās ielejas efekts.

AI iepriekš ir pierādījis, ka ir iespējama pārliecinošu dziļu iespaidu radīšana, taču tam bija vajadzīgi vairāki vēlamā objekta leņķi. Jaunajam pētījumam inženieri iepazīstināja AI ar ļoti lielu atsauces video datu kopu, kas parāda cilvēku sejas darbībā. Zinātnieki izveidoja sejas orientierus, kas attiektos uz jebkuru seju, lai iemācītu neironu tīklam, kā sejas parasti uzvedas.

Pēc tam viņi apmācīja AI izmantot atsauces izteiksmes, lai kartētu avota pazīmju kustību. Tas ļāva AI izveidot dziļu iespaidu pat tad, ja tam bija tikai viens attēls, no kura strādāt, ziņoja pētnieki.

Un vairāk avotu attēlu gala animācijā ieguva vēl detalizētāku rezultātu. Video, kas izveidoti no 32 attēliem, nevis tikai no viena, lietotāju pētījumā sasniedza "perfektu reālismu", rakstīja zinātnieki.

Send