Harry Potter by Balenciaga : quand ChatGPT, Midjourney et D-ID créent des deepfakes hilarants… et inquiétants

Depuis quelques semaines, une série d’étranges vidéos mettent en scène les personnages les plus connus de la pop culture (Harry Potter, le Seigneur des Anneaux, Breaking Bad…). Petite particularité : tous s’emploient à chanter les louanges de la marque Balenciaga. Autant de très bons exemples de deep fake… et qui posent de sérieuses questions quant aux outils ayant servi à les créer.

Harry Potter by Balenciaga : histoire d’un deepfake hilarant

« Tu es Balenciaga, Harry ». Dès les premières secondes, le ton est donné. Dans une ambiance imitant à la perfection celle des défilés de mode, Hagrid, Dumbledore ou encore le professeur Rogue enchaînent les références à la marque italienne de haute couture. Serait-ce là un épisode inédit de la saga Harry Potter ? Pas vraiment.

Un youtubeur nommé demonflyingfox, s’est amusé à créer une série de deepfakes, reprenant l’apparence et la voix des différents personnages – tout en les adaptant à l’atmosphère des fashion shows. La vidéo, publiée le 15 mars 2023, a déjà engrangé plus de 6,5 millions de vues – entraînant une vague d’imitations à sa suite.

Au-delà, le choix de Balenciaga ne doit rien au hasard, une photo du Pape François dans une « vraie-fausse » parka blanche inspirée du couturier italien ayant récemment fait le tour de la toile. Ironiquement, la marque n’a strictement rien à voir avec cette soudaine exposition médiatique Mais qui tombe à point nommé, alors qu’elle tente de se dépêtrer de plusieurs scandales.

ChatGPT, Midjourney, Elevenlabs, D-ID : générer un deepfake n’a jamais été aussi simple

D’une manière assez surprenante, la création de ce type de vidéos « plus vraies que nature » ne demande aucune compétence avancée sur After Effects. Comme l’explique un youtubeur nommé Prompt Jungle, la clé du succès réside dans une utilisation judicieuse de ChatGPT, de Midjourney, d’ElevenLabs et de D-ID. Une combinaison simple… et visiblement efficace.

Harry Potter By Balenciaga | Step by Step Tutorial

Dans le détail, ChatGPT est utilisé pour générer les « prompts », qui sont ensuite fournis à Midjourney pour obtenir les visuels des personnages portant des vêtements aux faux airs de Balenciaga. En parallèle, le vidéaste emploie la plateforme ElevenLabs pour « cloner » la voix des acteurs et leur faire prononcer la phrase de son choix.

Enfin, la voix et l’image sont « assemblés » au sein de l’outil D-ID, qui se charge d’animer la photo intelligemment, et de faire correspondre le mouvement des lèvres au texte prononcé. Il ne reste plus qu’à assembler les plans en une vidéo finale, et d’ajouter les effets de flash. Ce que Prompt Jungle effectue depuis l’application mobile Capcut.

Des deepfakes bien innocents… mais de sérieuses questions éthiques

Ces vidéos jouent adroitement sur le décalage entre l’univers de ces personnages et leur posture froide et ô combien sérieuse (sans parler de leurs vêtements). Ces deepfakes s’avèrent donc bien innocents, les visionneurs étant parfaitement conscients de l’intention d’origine des vidéastes.

Mais les technologies ici employées posent question. Et, plus spécifiquement, la facilité avec laquelle ces différents outils peuvent être utilisés à des fins moins avouables

Le fait d’animer la photo d’une célébrité via D-ID peut paraître assez anodin ; mais qu’en est-il d’ElevenLabs, dont l’outil a seulement besoin d’un enregistrement d’une minute de la voix d’une personne pour pouvoir l’imiter à la perfection ? Ainsi, n’importe quel « plaisantin » pourrait faire dire ce qu’il veut à telle célébrité ou tel personnage politique… avec tous les risques de désinformation que cela comporte.

Dans tous les cas, ces vidéos – certes très amusantes – doivent nous faire réfléchir sur tous les nouveaux outils liés à l’IA et au traitement du langage naturel. Utilisés à bon escient, ils ouvrent de nombreuses possibilités créatives – en faisant revivre Marilyn Monroe, par exemple.

Mais ils risquent aussi de jouer un rôle massif dans la propagation de fake news, qui pourraient potentiellement duper des millions d’internautes. À ce titre, on notera qu’Elevenlabs a supprimé l’accès gratuit à son outil, craignant qu’il ne soit utilisé massivement à de mauvaises fins.

Autant de points qui rappellent, une fois de plus, la pertinence et la nécessité de projets comme la Content Authenticity Initiative, afin d’éviter la diffusion massive de vidéos truquées à des fins malveillantes.

Vous pouvez retrouver les vidéos de demonflyingfox et les analyses de Prompt Jungle sur leur chaîne Youtube respective.