takaisin alkuun
Maanantai 24
kotiInternetBisnesDeepfakes: Microsoft luo hyperrealistisia "puhuvia kasvoja" still-kuvista!

Deepfakes: Microsoft luo hyperrealistisia "puhuvia kasvoja" still-kuvista!

Microsoft Research ravistelee tekoälyn maailmaa uudella kokeellisella sovelluksellaan VASA-1. Πρόκειται για μια AI που μπορεί να μετατρέψει μια στατική εικόνα προσώπου – ακόμα και σχέδιο – σε ένα ρεαλιστικό βίντεο που μιλάει, σε πραγματικό χρόνο! VASA-1 δημιουργεί εκφράσεις και κινήσεις κεφαλής που συγχρονίζονται τέλεια με υπάρχον ηχητικό αρχείο, είτε πρόκειται για ομιλία ή τραγούδι. Στη σελίδα του project υπάρχουν πολλά παραδείγματα, τόσο καλοφτιαγμένα που θα μπορούσαν να ξεγελάσουν ακόμα και παρατηρητικό θεατή.

Αν και σε προσεκτική παρατήρηση οι κινήσεις τν χειλιών και του κεφαλιού στα παραδείγματα μπορεί να φαίνονται λίγο ρομποτικές και εκτός συγχρονισμού, η δυνατότητα κατάχρησης της τεχνολογίας είναι ξεκάθαρη. Με το VASA-1 θα μπορούσαν να δημιουργηθούν εύκολα και γρήγορα deepfakes πραγματικών ανθρώπων. Οι ερευνητές της Microsoft αναγνωρίζουν αυτόν τον κίνδυνο και προς το παρόν δεν προτίθενται να δημοσιεύσουν “online , API, εμπορικό προϊόν, πρόσθετες λεπτομέρειες υλοποίησης ή οποιαδήποτε σχετική υπηρεσία” μέχρι να βεβαιωθούν ότι η τεχνολογία τους “θα χρησιμοποιηθεί με υπευθυνότητα και σύμφωνα με τους κανονισμούς.” Δεν αναφέρθηκε, ωστόσο, αν σχεδιάζουν να εφαρμόσουν συγκεκριμένους περιορισμούς για να αποτρέψουν κακόβουλη χρήση, όπως τη δημιουργία deepfake πορνό ή fake news.

Huolesta huolimatta tutkijat uskovat, että VASA-1:llä on valtava potentiaali positiivisiin sovelluksiin. Se voi auttaa yhtäläistä pääsyä koulutukseen, parantaa vammaisten kommunikaatiota ja ehkä antaa heille avatarin, joka puhuu heidän puolestaan. Lisäksi se voisi tarjota kumppanuutta ja terapeuttista tukea sitä tarvitseville ihmisille, mikä tasoittaa tietä ohjelmille, joissa on AI-hahmoja, joiden kanssa käyttäjät voivat keskustella.

Ilmoituksen yhteydessä julkaistun tutkimuspaperin mukaan VASA-1 koulutettiin VoxCeleb2-tietojoukossa, joka sisältää "yli miljoona lausetta 1 6.112 julkkiselta" YouTube-videoista. Vaikka työkalu on koulutettu oikeille kasvoille, se toimii myös taiteellisissa valokuvissa, kuten Mona Lisassa. Humoristisella tuulella tutkijat yhdistivät sen äänitteeseen Anne Hathawayn Lil Waynen kappaleesta Paparazzi. Tulos on ihastuttava ja näkemisen arvoinen, vaikka kyseenalaistat tällaisen tekniikan hyödyllisyyden.

Marizas Dimitris
Marizas Dimitrishttps://www.techwar.gr
Samsungin matkapuhelimien omistautunut fani Dimitris on kehittänyt erityisen suhteen yrityksen tuotteisiin arvostaen niiden tarjoamaa muotoilua, suorituskykyä ja innovaatioita. Teknisten uutisten kirjoittaminen ja lukeminen ympäri maailmaa.
AIHEESEEN LIITTYVÄT ARTIKKELIT

JÄTÄ VASTAUS

kirjoita kommenttisi!
ole hyvä ja kirjoita nimesi tähän

Suosituin

Viimeiset artikkelit