La création d’images photoréalistes ex nihilo par l’intelligence artificielle avance à grands pas. Et ce n’est pas Aurel Manea qui vous dira le contraire. En utilisant une nouvelle solution nommée Stable Diffusion – concurrente de Dall- E 2 – le photographe bulgare a généré pas moins de 1200 « photos de paysage » plus vraies que nature. Un point qui pose de sérieuses questions éthiques…

Stable Diffusion : une flopée d’images de paysages photoréalistes en quelques secondes
L’intelligence artificielle n’en finit pas de progresser. Après l’IA capable de créer des photos de portrait de personnes qui n’existent pas, et l’IA qui anime vos photos de famille, voici venir l’ère du « text-to-image« .
Le principe : à partir de quelques mots seulement, la solution crée un cliché réaliste, s’appuyant sur une profusion d’images légendées. En étant capable de comprendre ce que représente une image, différentes solutions comme DALL-E 2 ou Imagen de Google sont capable de produire de « vraies-fausses photo » plus vraies que nature.
C’est en utilisant les possibilités offertes par ce type d’IA que le photographe Aurel Manea a pu réaliser une série de « photos de paysage » ultra-réalistes. Il s’est basé sur une nouvelle solution, Stable Diffusion, actuellement disponible en beta. D’après le photographe, Dall-E 2 est excellent pour la création de portraits photoréalistes, mais nettement moins pour les paysages.

L’IA, danger supplémentaire pour les photographes professionnels ?
« En tant que photographe de paysage, je ne saurais trop insister sur l’impact qu’auront ces nouvelles technologies sur la photographie », indiquait Aurel Manea.
« Bien sûr, ce ne sont pas de vraies photos et elles ne font que ressembler à des endroits bien réels (pour l’instant, étant donné que le nombre d’images sources s’agrandit). Mais pour la majorité des personnes utilisant des images, seule leur beauté importera », détaille le photographe.

Et Aurel Manea pointe parfaitement le problème que pose ce type d’intelligence artificielle. Les photographes de paysage sont déjà largement concurrencés par les banques d’images gratuites. Mais ils pourraient bien subir la concurrence de ce type d’IA, capable de produire de superbes images photoréalistes en quelques secondes.
Un point qui devrait justement séduire de nombreux concepteurs de site web et de brochures à la recherche d‘images génériques pour illustrer leurs supports de communication.

La preuve : grâce à Stable Diffusion, Aurel Manea a pu créer la bagatelle de 1200 (!) images en une vingtaine de minutes. Une vitesse de production sans commune mesure avec le travail d’un vrai photographe (recherche du lieu, temps de déplacement, capture des photos, retouche).
Pour l’heure, les lieux représentés sur ces images sont parfaitement fictifs. De même, les résultats obtenus sont parfois mitigés. Certaines des « photos » générées par Stable Diffusion sont esthétiquement très plaisantes… Mais certaines le sont nettement moins. Mais ce n’est qu’une question de temps. Au fur et à mesure de ses évolutions, l’IA deviendra de plus en plus performante. Ce qui pourrait poser une menace réelle pour les photographes professionnels.

Les failles éthiques posées par l’IA
Dans ses explications, Aurel Manea soulève un point intéressant. Si Dall-E 2 ne parvient pas (encore) à générer de « photos » de paysages, c’est notamment grâce à une décision de ses créateurs. Ces derniers, en effet, ont volontairement exclu les photographies contemporaines de paysages de la base ayant servi à l’entraînement de l’IA.
De son côté, Stable Diffusion se distingue de ses concurrents en étant en Open Source. Mais aussi (et surtout) en ne possédant aucun filtre au niveau des contenus exploités (et générés).

« En indiquant quelques mots simples comme « Photo de paysage par Marc Adamus, lac gelé, soleil couchant, lumière spectaculaire, montagnes, nuages, magnifique », j’ai réussi à générer bon nombre d’images satisfaisantes », explique Aurel Manea.
Ce qui, en d’autres termes, indique que la base ayant servi à l’entraînement de l’IA contient sans doute des milliers de photos soumises au droit d’auteur, récoltées sur Internet – sans probablement sans l’accord de leur auteur. Un point qui soulève de nombreuses questions en termes de propriété intellectuelle.

D’autre part, la relative absence de filtres de Stable Diffusion pourrait faciliter la création de deep fakes, en créant des montages « plus vrais que nature » – en utilisant le visage de personnalités publiques ou de célébrités, notamment.
En un mot comme en cent, l’IA ne cesse de faire d’accomplir des prodiges… Mais c’est à ses concepteurs – bien humains, ceux-là – qu’il incombe d’imposer certaines limites pour éviter les dérives en tout genre. Mais aussi pour protéger et pérenniser le travail des artistes et des photographes professionnels.