Dall-E, Midjourney, Stable Diffusion : quand les photos générées par l’IA brouillent notre rapport au réel

Depuis quelques mois, elles semblent envahir Internet – et brouillent notre perception de la réalité. Elles, ce sont les images générées par des IA. De Dall-E à Stable Diffusion, de Midjourney à Imagen, leurs « prouesses » n’en finissent pas de faire réagir. Phototrend revient sur ce phénomène de grande ampleur à travers 3 exemples concrets : la Une du dernier numéro du magazine Réponses Photo, un visuel autour du récent séisme en Turquie, et la « photo » gagnante d’un concours australien.

Dall-E, crée-moi une photo plus vraie que nature

Jusqu’ici très confidentielles – et cantonnées à quelques projets de recherche – les images générées par l’intelligence artificielle ne cessent d’étonner et de faire couler de l’encre (numérique).

Mais au fond, qu’est-ce qu’une image « créée » par l’IA ? Elles sont le fruit d’un système de « text-to-image » : l’utilisateur entre une requête, et le programme conçoit une image (dessin, peinture, photo…) correspondant à cette requête. Un procédé similaire à celui employé par ChatGPT, capable de rédiger des textes de plusieurs paragraphes à partir d’une requête de quelques mots.

Naturellement, ces différents programmes – Dall-E, Midjourney, Stable Diffusion et bien d’autres encore – posent un certain nombre de questions. D’une part, les images ainsi générées ne sortent pas « de nulle part ». Ces différentes IA ont ainsi été « entraînées » à partir de millions d’images trouvées sur Internet, notamment sur Flickr, Wikipédia, Shutterstock – posant de sérieuses questions quant au respect du droits d’auteur.

Une image créée de toute pièce avec Dall-E en utilisant la requête « un photographe capturant une image de la Tour Eiffel la nuit, avec du bokeh ». Si le rendu de la main du photographe (et la scène présentée sur son smartphone) posent question, le rendu de la Tour Eiffel est convainquant.

Sans parler des travailleurs (bien humains, ceux-là), rémunérés au lance-pierre, chargés de « cadrer » les résultats de l’IA pour éviter la prolifération de contenus problématiques.

D’autre part, ces images perturbent notre rapport au réel. Comment différencier une « vraie » photo, capturée par un photographe en chair et en os, d’une image « plus vraie que nature », mais générée par l’ordinateur ? Certes, ce questionnement existe déjà depuis l’avènement de Photoshop. Mais la facilité avec laquelle on peut obtenir (gratuitement) ces « vraies-fausses photos » laisse pantois.

Nous avons ainsi voulu décrypter 3 cas pratiques, où les images générées par l’IA viennent profondément bouleverser notre rapport au réel.

« IA, photographie-moi un marin » : la Une provocatrice de Réponses Photo

Au premier abord, rien ne permet de différencier la Une du numéro de mars 2023 du magazine Réponses Photo. On y découvre le portrait d’un homme à la barbe blanche, dont les rides profondes sont soulignées par un éclairage subtil. De délicates bulles de bokek viennent habiller l’arrière-plan.

Couverture du numéro 357 du magazine Réponses Photo

Sauf que le marin de cette photo… n’existe pas. Pas plus que son bateau à l’arrière-plan. « Cette image a en réalité été générée par Midjourney, un programme d’intelligence artificielle à qui on a demandé de concevoir la photo d’un marin de nuit, devant son bateau, par un temps pluvieux, réalisée à l’aide d’un appareil photo argentique moyen format et avec du bokeh », explique Thibaut Godet, rédacteur en chef du magazine.

L’image créée par Midjourney et utilisée en Une par le magazine Réponses Photo

Le but de Réponses Photo : illustrer son dossier sur la photo de nuit – mais surtout troubler la perception de ses lecteurs. « Aurait-on imaginé il y a seulement un an ou deux que l’on vous présenterait une telle image en couverture ? Non. C’est dire à quelle vitesse ont évolué ces derniers mois. Et leur marge de progression est encore abyssale », poursuit le journaliste. Qui précise que 300 essais (!) ont été nécessaires avant d’obtenir le visuel de ce marin.

Par jeu, nous avons eu l’idée de soumettre la même requête que Réponses Photo à l’IA de Midjourney. Les résultats sont loin d’être aussi qualitatifs que la photo utilisée en Une du magazine, montrant le caractère relativement aléatoire de l’IA – et la nécessité de multiplier les tentatives avant d’arriver à un résultat satisfaisant.

Mais il est certain qu’une telle image, en Une d’un magazine photo, a clairement de quoi dérouter. Une manière d’interpeller le lecteur, de susciter en lui un questionnement autour de ces technologies et de leur impact. Et un joli coup de pub pour le magazine, dont l’initiative a été relayée outre-Atlantique par le média PetaPixel.

Le jury d’un concours photo trompé par une photo générée par une IA

Le 1er février 2023, le compte Instagram de Digidirect, revendeur de produits high-tech, dévoilait la photo gagnante de son concours photo estival. Très spectaculaire, l’image primée nous fait découvrir une plage où déferle une vague aux tons bleu foncé, baignant dans la lumière orangée d’un soleil couchant.

Problème : cette photo gagnante, cette vague impressionnante – et les surfeurs au centre de l’image… sont totalement artificiels. Dans un commentaire, posté peu de temps après le post de Digidirect, un studio nommé Absolutely AI avoue avoir créé cette image de toute pièce.

Photo gagnante du concours Digidirect générée par Absolutely AI

Cette dernière devient ainsi la première « photo » générée par une IA à gagner un concours photo – surpassant de fait toutes les « vraies » images créées par des photographes en chair et en os.

« Une image générée par l’IA pourrait-elle non seulement passer inaperçue (aucune des personnes ayant vu l’image n’a perçu quelque chose d’inhabituel), mais aussi se voir décerner le premier prix par un expert en photographie ? La réponse est un oui retentissant », indique, un brin péremptoire, Absolutely AI dans un communiqué.

Quoi qu’il en soit, beaucoup voient en cette photo gagnante un véritable signal d’alarme. Et rappellent l’urgence de développer, à brève échéance, des solutions pour garantir l’authenticité des photographies numériques. Et, à l’inverse, détecter les fausses images. « Les professionnels de l’image devront plus que jamais interroger le contenu des photos, vérifier les métadonnées, décortiquer les fichiers, pour ne pas se laisser duper, et risquer de tromper le public dans la foulée », détaille Thibaut Godet dans Réponses Photo.

L’enfant turc secouru par un pompier grec : de l’émotion à la désinformation

Le 6 février 2023, un séisme frappait la Turquie et la Syrie, causant la mort de plus de 35 000 personnes. Immédiatement de nombreux messages de soutien fleurissent sur les réseaux sociaux, saluant l’héroïsme des sauveteurs. 

Deux jours plus tard, Panagiotis Kotridis, ancien commandant des pompiers grecs, postait un message Facebook. « Pour honorer mes collègues qui donnent le meilleur d’eux-mêmes afin de sauver les personnes touchées par les tremblements de terre en Turquie, j’ai réalisé cette photo », indique-t-il.

Le message est accompagné d’un visuel montrant un sauveteur de l’EMAK (les services d’urgence grecs) portant dans ses bras un petit enfant turc. Comme un symbole d’unité entre les deux pays, au-delà des dissensions autour de l’île de Chypre. L’image devient immédiatement virale, étant reproduite et relayée plusieurs milliers de fois en quelques heures.

À tel point que bon nombre d’internautes semblent avoir oublié un point essentiel : cette image, aussi touchante soit-elle… a été générée grâce à Midjourney et Photoshop. D’ailleurs, certains éléments permettent de s’en rendre compte assez rapidement : l’aspect plutôt lisse de l’image, l’atmosphère assez laiteuse… ou encore les 6 doigts de la main droite du secouriste !

Pourtant, ceci n’a pas empêché bon nombre d’internautes de partager ce visuel comme s’il s’agissait d’une vraie photo. Et de faire appel au champ lexical de l’émotion. « Il y [a] tant d’humanité dans cette photo », twittait ainsi une personne dans un message liké près de 4700 fois.

Ce dernier point est assez préoccupant. Car il suffirait à une personne (plus ou moins bien intentionnée) de produire une image « émouvante » via une IA pour que celle-ci soit partagée sans discernement à très grande échelle.

Certes, les fake news n’ont pas attendu l’arrivée de Midjourney, Stable Diffusion ou Dall-E pour se propager sur les réseaux sociaux. Mais là encore, la facilité – et le coût dérisoire – avec laquelle n’importe qui peut créer une image « plus vraie que nature » pose un vrai problème quant à la fiabilité des informations qui circulent sur la toile.

Les 4 résultats livrés par Midjourney avec la requête « Donald Trump embrassant Vladimir Poutine devant la Maison Blanche ». Si les 2 premières images nous laissent dubitatives, la 3e est nettement plus convaincante.

En clair : il est indispensable de ne pas être emporté par ses émotions – et de faire fonctionner notre esprit critique. Un point qui, justement est rendu plus complexe avec l’apparition de ces « vraies-fausses photos » générées par l’IA.

Ces images sont-elles des photographies ?

Nous aurions pu continuer cette analyse avec bien d’autres exemples. Un internaute américain a ainsi partagé ces photos de soirées créées avec Midjourney – qui semblent sortie des années 90… mais où les jeunes filles sur les images possèdent 7 doigts et une dentition assez étrange.

Sur une note plus légère, mentionnons aussi la vidéo de l’humoriste britannique John Oliver, consterné que l’IA soit incapable de représenter son mariage… avec un chou.

AI Images: Last Week Tonight with John Oliver (HBO)

Au-delà, ces différents exemples interrogent notre rapport à l’image. Comment – et où – situer la frontière entre une « vraie » photo et une image créée par une IA ? Étymologiquement, photographier consiste à « écrire avec de la lumière ». Si aucune lumière n’a été utilisée pour la réalisation de ces images, il ne s’agit pas de photographies.

Pourtant, nous dirons certains, le trucage de photos existe depuis l’invention de la photographie. Et des logiciels comme Photoshop ont recours à l’IA pour nous permettre de modifier plus facilement nos images. 

Sans oublier un logiciel comme Luminar AI, par exemple, qui facilite le remplacement du ciel d’une photo par un autre, parfaitement artificiel.  Mieux encore, il est possible d’entraîner l’IA avec ses propres photos, fournissant une base « bien réelle ».

In fine, il demeure une question cruciale : celle de l’intention. Lorsqu’un photographe (humain) déclenche son appareil photo, il le fait afin de figer un fragment d’une situation telle que perçue par lui à un instant T. Chose qu’une IA aurait bien du mal à faire, puisqu’elle ne fait qu’imiter cette intention première du photographe en se basant sur les photos de sa bibliothèque.

Dans tous les cas, l’irruption de ces technologies questionne notre rapport au réel, à la vérité que vient reproduire une photographie. Et puisque ces plateformes n’en sont qu’à leurs balbutiements, il est primordial d’en saisir tous les enjeux dès à présent.

A lire également : 15 astuces pour détecter une image générée par une IA

Responsable éditorial

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

  1. Comme un chien qui mort sa queue..
    Bonjour,
    il est étonnant de voir qu’on cherche la solution à ces fausses images dans la technologie (authentification numérique, détection d’IA …) alors que le problème vient justement de là. On s’était déjà émerveillé devant les prouesses de Photoshop,Luminar ou autre pour changer une photo quelconque en fond d’écran clinquant. Pourtant il y a bien longtemps qu’on aurait dû répondre à ces questions par une meilleure éducation à l’image axée sur l’esthétique, la rigueur de la pratique et la sincérité de l’émotion. Depuis le temps que les médias et les réseaux sociaux diffusent des images lisses, retouchées et stéréotypées il n’est maintenant pas très difficile à l’AI de nous faire aimer n’importe quoi. Est-ce l’IA qui progresse ou notre intelligence qui sommeille ?

  2. Bonjour, le terme « intelligence » est de plus en plus galvaudé et me parait parfaitement inapproprié dans 95% des cas et particulièrement ici. Ces logiciels, car c’est bien de ça qu’il s’agit, sont à mon sens des « agrégateurs » plus ou moins habiles qui vont piocher ici ou là des images existantes et les amalgament de façon assez maladroite et sur des principes qu’une intelligence humaine avec ses failles et ses faiblesses a déterminé en amont, principes que ne peut dépasser l’IA. Où est donc l’intelligence ici ? On pourra parler d’intelligence le jour ou la machine aura compris que si l’humain intelligent lui coupe l’électricité… elle sera… morte. L’intelligence artificielle n’existe que dans le cerveau des marketeurs qui seraient prêts à tout pour nous fourguer plus de tout. Le reste me parait de l’anticipation genre « Skynet, Sarah Connor, Terminator… »

    C’est un peu comme les « éco-systèmes » photographiques (et pas que…) qui n’ont rien d’éco puisque pour être éco un système doit être biologique par définition. C’est déjà pas mal d’être un système.

    Donc amis journalistes, les mots ont un sens, vous êtes bien placés pour le savoir. Ne vous laissez pas embarquer par les vendeurs de cravates. À ce sujet votre conclusion est rassurante : vous parlez d’intention, j’y rajouterai le style, élément fondamental dans toute forme de création.

    La supposée intelligence n’a qu’a bien se tenir.

  3. Bonjour,je pense que cette technique va concurrencer les créateurs professionnels: photographes, graphistes et même si l’on peut le coupler avec une imprimante 3D, les sculpteurs.Elle ne les fera pas disparaître pour autant, les créatifs seront toujours des créatifs mais avec des outils complémentaires dont cette technique car si l’on regarde les débuts de la photographie on voit bien que cela n’a pas fait disparaître la peinture mais la fait s’orienter plus vers l’abstraction sans toutefois abandonner le figuratif. J’aimerais essayer d’utiliser cette technique pour remplacer ces montages et collages que je fais parfois à partir de photographies ( les miennes où celles des autres)car c’est un loisir qui est aussi un travail fastidieux, mais, bon, on touche alors à la paresse…

  4. Ça fait peur et c’est préoccupant!
    Cette IA est impressionnante et la puissance de calcul des machines ne va pas arranger les choses.
    Ici ce sont des images, on peut encore avoir des doutes, mais ça existe pour les mots et les sons… Un jour vous aurez votre arrière-grand-mère au téléphone, décédée il y a 20 ans!
    Ça fait vraiment flipper sur les utilisations en masse, tromper des foules, des peuples et tout ça que cela peut engendrer…

  5. Cette Intelligence Artificielle (ou peu importe le nom donné à cet artifice de la photo) n’en est qu’à ses débuts. Il ne fait aucun doute qu’elle se perfectionnera (avec l’aide d’informaticiens! 🙂 ) au point qu’elle produira des photos avec lesquelles on ne parviendra plus à savoir qui ou quoi les auront réalisées!

    L’authenticité aura toujours sa place. Voulez-vous voir une photo composée artificiellement de la côte sauvage de la Californie? ou une véritable photo de la Californie? Même question pour une photographie animalière, pour la macro, etc…
    Le jus d’orange fait de concentrés et le pur jus 100% d’orange ont leurs places.

    La photographie artificielle a sa place dans un contexte pratique…. faudrait juste qu’on le sache!
    Peut-être est-ce un nouveau départ pour la photographie 100% pur jus, sans artifice, sans retouche??