Le vrai du faux : ces photos de paysages ultra-réalistes ont été créées de toute pièce par une IA

La création d’images photoréalistes ex nihilo par l’intelligence artificielle avance à grands pas. Et ce n’est pas Aurel Manea qui vous dira le contraire. En utilisant une nouvelle solution nommée Stable Diffusion – concurrente de Dall- E 2 – le photographe bulgare a généré pas moins de 1200 « photos de paysage » plus vraies que nature. Un point qui pose de sérieuses questions éthiques… 

© Aurel Manea

Stable Diffusion : une flopée d’images de paysages photoréalistes en quelques secondes

L’intelligence artificielle n’en finit pas de progresser. Après l’IA capable de créer des photos de portrait de personnes qui n’existent pas, et l’IA qui anime vos photos de famille, voici venir l’ère du « text-to-image« .

Le principe : à partir de quelques mots seulement, la solution crée un cliché réaliste, s’appuyant sur une profusion d’images légendées. En étant capable de comprendre ce que représente une image, différentes solutions comme DALL-E 2 ou Imagen de Google sont capable de produire de « vraies-fausses photo » plus vraies que nature

C’est en utilisant les possibilités offertes par ce type d’IA que le photographe Aurel Manea a pu réaliser une série de « photos de paysage » ultra-réalistes. Il s’est basé sur une nouvelle solution, Stable Diffusion, actuellement disponible en beta. D’après le photographe, Dall-E 2 est excellent pour la création de portraits photoréalistes, mais nettement moins pour les paysages

© Aurel Manea

L’IA, danger supplémentaire pour les photographes professionnels ?

« En tant que photographe de paysage, je ne saurais trop insister sur l’impact qu’auront ces nouvelles technologies sur la photographie », indiquait Aurel Manea. 

« Bien sûr, ce ne sont pas de vraies photos et elles ne font que ressembler à des endroits bien réels (pour l’instant, étant donné que le nombre d’images sources s’agrandit). Mais pour la majorité des personnes utilisant des images, seule leur beauté importera », détaille le photographe. 

© Aurel Manea

Et Aurel Manea pointe parfaitement le problème que pose ce type d’intelligence artificielle. Les photographes de paysage sont déjà largement concurrencés par les banques d’images gratuites. Mais ils pourraient bien subir la concurrence de ce type d’IA, capable de produire de superbes images photoréalistes en quelques secondes.

Un point qui devrait justement séduire de nombreux concepteurs de site web et de brochures à la recherche d‘images génériques pour illustrer leurs supports de communication

© Aurel Manea

La preuve : grâce à Stable Diffusion, Aurel Manea a pu créer la bagatelle de 1200 (!) images en une vingtaine de minutes. Une vitesse de production sans commune mesure avec le travail d’un vrai photographe (recherche du lieu, temps de déplacement, capture des photos, retouche). 

Pour l’heure, les lieux représentés sur ces images sont parfaitement fictifs. De même, les résultats obtenus sont parfois mitigés. Certaines des « photos » générées par Stable Diffusion sont esthétiquement très plaisantes… Mais certaines le sont nettement moins. Mais ce n’est qu’une question de temps. Au fur et à mesure de ses évolutions, l’IA deviendra de plus en plus performante. Ce qui pourrait poser une menace réelle pour les photographes professionnels. 

© Aurel Manea

Les failles éthiques posées par l’IA

Dans ses explications, Aurel Manea soulève un point intéressant. Si Dall-E 2 ne parvient pas (encore) à générer de « photos » de paysages, c’est notamment grâce à une décision de ses créateurs. Ces derniers, en effet, ont volontairement exclu les photographies contemporaines de paysages de la base ayant servi à l’entraînement de l’IA. 

De son côté, Stable Diffusion se distingue de ses concurrents en étant en Open Source. Mais aussi (et surtout) en ne possédant aucun filtre au niveau des contenus exploités (et générés)

© Aurel Manea

« En indiquant quelques mots simples comme « Photo de paysage par Marc Adamus, lac gelé, soleil couchant, lumière spectaculaire, montagnes, nuages, magnifique », j’ai réussi à générer bon nombre d’images satisfaisantes », explique Aurel Manea.

Ce qui, en d’autres termes, indique que la base ayant servi à l’entraînement de l’IA contient sans doute des milliers de photos soumises au droit d’auteur, récoltées sur Internet – sans probablement sans l’accord de leur auteur. Un point qui soulève de nombreuses questions en termes de propriété intellectuelle. 

© Aurel Manea

D’autre part, la relative absence de filtres de Stable Diffusion pourrait faciliter la création de deep fakes, en créant des montages « plus vrais que nature » – en utilisant le visage de personnalités publiques ou de célébrités, notamment. 

En un mot comme en cent, l’IA ne cesse de faire d’accomplir des prodiges… Mais c’est à ses concepteurs – bien humains, ceux-là – qu’il incombe d’imposer certaines limites pour éviter les dérives en tout genre. Mais aussi pour protéger et pérenniser le travail des artistes et des photographes professionnels

Responsable éditorial

Votre adresse e-mail ne sera pas publiée.

  1. Hello,

    Un prodige ? Juste du calcul à partir de motifs d’une banque d’image bien «taguées» pompé grâce à ce que tous les internautes lâchent sur les réseaux sociaux (quia dit propriété intellectuelle ?) avec des tonnes de calques de fusion à la fin, rien de plus pour faire dans les grandes lignes. De la puissance et du détail avec le temps, à quel prix ! Dans l’histoire du logiciel, la génération de paysage et le photo réalisme existait déjà sous forme de lancé de rayon. Qui se souvient de ‘Poser’ (1995) pour les modèles ? Ou encore de ‘Bryce’ (1994) pour des paysage incroyables ? Nul IA, terme fourre-tout, pas d’internet comme celui actuel.

    Ce n’est pas une profession qui est menacée (une de plus) – il y a à peine 6 ans, personne ne se sentait menacé, c’était une aide dont tout le monde se réjouissait pour que le professionnel gagne en productivité et satisfaction client. Un outil rangé au même titre que la retouche : retoucher n’est pas tromper/tricher. La prétention de se croire toujours supérieur et d’avoir (ou d’autres) le contrôle absolu sur tout. Aujourd’hui le ton semble bien différent. En si peu de temps; et dans 6 autres années, que va-t-il se passer ?

    Notre gros soucis est celui qui va nous pourrir jusqu’au trognon, c’est celui du faire faire (qui n’est ni la liberté, ni l’autonomie) et de préférence sans l’élément faillible, c’est à dire sans celui qui ose prétendre à vivre de cela et qui forcément ne va pas être parfait.
    Pourquoi un client viendrait me voir et me payer alors qu’il pourra à la demande placer son petit dernier dans un œuf façon A.Geddes en un clic ou bien de placer son mariage sur l’île de Nahlapenlohd, pourtant engloutie à cause de la montée des eaux, après quelques recherches d’originalité ? Pourquoi faire un safari quand le souvenir ne prendra plus sa réalité, preuve matérielle, que dans des datacenter ? Après croire sur parole, croire sur google…

    Regardons aussi où s’est logé l’informatique depuis ses débuts et regardons ce qui a été automatisé, supervisé, contrôlé, connecté, embelli, etc. depuis. L’«IA» est la même chose mais en mieux, ou en pire. Quels seront nos efforts encore à faire face à tout cela, que restera-t-il de liberté si en plus nous saccageons l’environnement pour ce paradis annoncé au point de se faire de plus en plus confiné ou entravé (il faut dorénavant réserver pour se promener sur une partie des Calanques) tant que nous pouvons voir ou fantasmer sur du «beau», voire mieux, sur un écran, dans notre salon et à partager avec nos amis, à distance ? Et notre imagination, si un algorithme couplé aux dernières découverte des neurosciences et après profilage de votre personnalité propose la génération de clichés bien plus efficaces pour satisfaire nos centres de plaisirs, à quoi servirait-elle à part un ersatz naturel de piètre qualité/valeur et donc source possible de frustration ?

    On se dévalorise et on se dévalorisera plus encore avec toutes ses cochoncetés. Malheureusement pour nous, peu semblent enclin à abandonner cette voie délétère tracée par les promesses issues des NBIC. Allons-y donc à fond !

    Oui, je suis
    EnColère

  2. Personnellement cela ne me surprend pas, je travaille dans les deux parties : photo pro et ingénieur info (IA…). ça fait 15 ans que je prédis ce type d’évolution.

    Et ça fait depuis au moins depuis 1991 que les logiciels de création de paysage existes. J’utilisais Vista pro sur Amiga. Est-ce que le métier de photographe va disparaitre ? Non, faut arrêter d’avoir peur du progrès et monter en compétences…

    Et n’oubliez jamais que ce n’est pas Sony, Canon ou Nikon les plus gros vendeurs d’APN mais Samsung 😉 va falloir se mettre à android 😂

    1. Bonjour Franck, merci pour votre commentaire.
      Effectivement, cette évolution était prévisible en un sens, mais son impact devient de plus en plus palpable. Comme je l’expliquais dans cet article, la plupart des agences n’iront pas s’embarrasser à faire appel à un photographe pour une « belle » image de paysage générique (d’autant qu’elles ont déjà massivement recours aux banques d’images).
      Il ne s’agit pas d’avoir « peur du progrès », comme vous l’indiquez. L’idée est bien plus d’être conscient de ces nombreuses évolutions, de connaître leur potentiel… et de savoir s’adapter.
      Quant aux fournisseurs de matériels, il est encore plus intéressant de voir les parts de marché des capteurs photo : à ce petit jeu, Sony est n°1, s’arrogeant quasiment 50 % de part de marché !

    2. Les rêves cybernétique, d’industrialisation et d’automatismes, j’ai réussi à passé ce cap il y très longtemps pour en voir la réalité concrète.

      Citius, Altius, Fortius. Les prédictions en ce sens n’ont aucune importance, nous connaissons tous la logique sinon la litanie du progrès et ses promesses quel que soit le nom du ou des champions, pourvu qu’on ne regarde nulle part ailleurs – que ce soit la progression des microplastiques ou autres PFAS à chaque gorgées d’eau, les e-déchets, les progrès cognitifs en tout domaine des enfants surexposés « aux écrans » de plus en plus jeunes, la demande énergétique incessante nécessaire avec ses GES et ses conséquences progressives sur le cycle de l’eau, jusqu’à cette biodiversité qui ne cesse de progresser aussi. Beaucoup de photographes en ont bien malgré tout conscience mais ne manifestent pas toujours un changement de pratiques (dont nous pourrions tous s’inspirer); la route peut être longue pour chacun.

      La question si les cochers ont disparus, bien évidemment que non ! Seulement être un survivant aujourd’hui ne signifie pas non plus avoir été invincible sur une pression technologique sélective. Que ce soit pour guider vos chevaux comme votre œil sensible.
      ‘monter en compétences’, course aux armements… cela suggère une forme de darwinisme, je suppose donc qu’il faut toujours être derrière la remorque de «ceux» qui font le progrès, comme les ingé info j’imagine 😉 – ce n’est pas du ad-hominem, cracher sur un métier et/ou la main qui nourrit n’est pas blasphématoire.

      Il n’est donc pas question de peur du progrès, ni du scepticisme pavlovien, mais de savoir où cela nous mène exactement. Être lucide et critique plutôt qu’y vouer une confiance absolue et rester aveugle aux conséquences qui nous reviennent comme une majoration forfaitaire. Car si c’est probablement plus facile pour quelques personnes maîtrisant ces outils, ça ne l’est par pour tous, s’il faut maîtriser, en plus des sujets de son métier, toutes celles qui sont liées à l’outil roi (l’ordinateur, le smartbidule, du logiciel au choix jusqu’à l’OS) et de se farcir limite une formation à chaque nouvelle montée de version car l’équipe de dev’ a changé son expert ux/ui en alternance pour cause de paradigme capricieux ou bien veut faire de la disruptive innov’ pour rallier l’écolo en chacun nous qui se réveil avec la sécheresse à la grande cause du greenwashing, le progrès à du plomb, et un gros paquet, dans l’aile.
      Trop facile, mais en tant qu’ancien tech’ info, j’ai appris que ce monde se considère petit, à juste titre je sais pourquoi maintenant. J’en reste pas moins misérable pour y avoir passé autant de temps.

      Les questions en filigrane du dernier paragraphe, qui ont été tournées en propositions quasi péremptoires resteront encore ouverte ; et pourtant, à mon sens, ce n’est nullement aux concepteurs-juge-partie que reviennent ces décisions (sauf désertion):

      «Mais c’est à ses concepteurs – bien humains, ceux-là – qu’il incombe d’imposer certaines limites pour éviter les dérives en tout genre. Mais aussi pour protéger et pérenniser le travail des artistes et des photographes professionnels.»

      Sinon, amen !
      Cordialement