Une équipe de chercheurs du laboratoire Samsung IA Center Moscow vient de dévoiler un nouveau mécanisme d’intelligence artificielle. Son but : animer des photos de visages à partir d’une ou plusieurs photos. Si le résultat n’est pas encore parfait, ce nouveau système ouvre de nombreuses possibilités créatives – notamment pour le cinéma – mais pourrait être aussi utilisé pour créer des fake videos ultra-réalistes.

Le centre de recherche AI Center de Moscou a ouvert ses portes en mai 2018, et vise à « aider l’entreprise à renforcer son leadership sur l’IA et à explorer l’ensemble des possibilités offertes par l’intelligence artificielle à destination du grand public », selon Samsung. Quatre chercheurs russes, Egor Zakharov, Aliaksandra Shysheya, Egor Burkov et Victor Lempitsky, ont récemment publié un article scientifique décrivant leurs travaux portant sur la création de « têtes parlantes » (talking heads) grâce à l’emploi d’un faible nombre d’images.

Pour ce faire, le mécanisme d’intelligence artificielle a été « entraîné » en utilisant plusieurs millions de photos. Toutefois, les quatre chercheurs du laboratoire Samsung vont encore plus loin, et indiquent que leur système peut fonctionner à partir de quelques images de référence seulement. L’IA est même capable de fonctionner avec une seule image de référence – même si le résultat demeure largement perfectible.

Dans la pratique, le système analyse les expressions faciales d’un individu (à partir d’une vidéo ou de photos statiques) et est capable de les reproduire de manière réaliste sur le visage d’une autre personne. D’après les membres du laboratoire de Samsung, ce procédé pourrait également être appliqué aux sujets d’un tableau, permettant ainsi d’animer le visage de Mona Lisa avec un réalisme troublant.

À l’image d’autres projets, cette IA se base sur un generative adversarial network (GAN). Ce procédé repose sur l’emploi de deux réseaux fonctionnant en coopération. Le premier, appelé « générateur », crée une image et le présente au second, nommé « discriminant ». Précédemment entraîné à partir de millions d’images, ce réseau « discriminant » va indiquer au « générateur » les zones à corriger (au pixel près), de sorte à améliorer le réalisme des images ainsi générées. Un procédé qui avait déjà été utilisé – entre autres – par Nvidia pour GauGan, un projet visant à créer des décors photoréalistes à partir de simples croquis, mais également pour thispersondosnotexist.com, capable de créer de toutes pièces des portraits de personnes qui n’existent pas dans la réalité.

GauGAN : la nouvelle IA de Nvidia transforme vos croquis en « photographies » réalistes

Les quatre chercheurs russes ont réussi à redonner vie à Marylin Monroe, à Albert Einstein ou à Salvador Dali, comme le montrent les images ci-après. Ce nouveau mécanisme d’intelligence artificielle ouvre donc de nouveaux débouchés à l’industrie du cinéma, qui pourrait faire « revivre » les stars hollywoodiennes disparues. Dans le jeu vidéo, ce système permettrait d’animer plus facilement et plus rapidement un plus grand nombre de personnages.

Toutefois, on pourrait également redouter une utilisation nettement moins honnête de ce système, par exemple pour la création de fausses déclarations plus vraies que nature, également appelées deepfakes. Cette IA pourrait ainsi permettre de faire dire tout et son contraire à des célébrités ou à différentes figures politiques.

On se souvient notamment de la (fausse) vidéo de Barack Obama insultant Donald Trump, et qui avait été fabriquée par le réalisateur Jordan Peele avec une méthode similaire. De la même manière, Lyrebird, une startup canadienne, avait dévoilé en 2018 une IA capable de cloner la voix des individus avec un réalisme stupéfiant.

Dans un contexte marqué par la prolifération de fake news et de rumeurs complotistes, cette nouvelle IA pose donc un certain nombre de questions d’ordre éthique. La manipulation de photos et de vidéos est loin d’être un fait nouveau : l’URSS passait maître dans la « suppression » de certains personnages politiques des photos officielles bien avant l’apparition de Photoshop. Toutefois, ce système permettrait d’aller beaucoup plus loin, et remet en question le sentiment de véracité qui émanait des vidéos (si la vidéo le montre, c’est que c’est la réalité, ce qui s’est réellement produit).

Plus que jamais, la question du discernement et de l’esprit critique s’avère donc plus que primordiale.