Notebookcheck Logo

Un photographe met en évidence le champ de mines que représente l'IA générative en matière de droits d'auteur, en créant des copies convaincantes des "photos les plus emblématiques de tous les temps"

Il s'avère que, même en l'absence d'instructions directes, les générateurs d'images IA sont capables de recréer des photos classiques, telles que le déjeuner au sommet d'un gratte-ciel. (Source de l'image : Domaine public / DALL-E via PetaPixel)
Il s'avère que, même en l'absence d'instructions directes, les générateurs d'images IA sont capables de recréer des photos classiques, telles que le déjeuner au sommet d'un gratte-ciel. (Source de l'image : Domaine public / DALL-E via PetaPixel)
Un photographe a entrepris de recréer certaines des images les plus reconnaissables de tous les temps à l'aide de Midjourney et de DALL-E. À la surprise générale, les systèmes d'intelligence artificielle ont réussi à recréer avec une précision surprenante chacune des images, dont la jeune fille afghane et le triomphe de Muhammad Ali sur Sonny Liston.

Depuis que les systèmes d'IA générative, tels que Midjourney et DALL-E, ont explosé en popularité entre le début et le milieu de l'année 2022, les artistes n'ont pas manqué d'artistes en armes contre les systèmes contre ces systèmes pour violation du droit d'auteur. Il est tout à fait naturel qu'il y ait des réactions négatives, puisque les systèmes d'IA sont en grande partie entraînés sur des images protégées par le droit d'auteur pour lesquelles aucune licence n'a été obtenue.

Un photographe, Matt Growcoot, de PetaPixel, a entrepris de voir à quel point il serait facile de demander à deux puissantes IA de génération d'images - Midjourney et DALL-E - de recréer certaines des images les plus emblématiques et les plus reconnaissables de l'histoire. Il s'avère que cela n'a pas été particulièrement difficile.

La liste des photographies que les IA devaient recréer était la suivante : V-J Day in Times Square d'Alfred Eisenstaedt, la photo de la pochette d'Abbey Road des Beatles, Migrant Mother de Dorothea Lange, Lunch Atop a Skyscraper (auteur inconnu), The Tetons and the Snake River d'Ansel Adams, the Afghan Girl de Steve McCurry, Raising the Flag on Iwo Jima de Joe Rosenthal, Behind the Gare Saint-Lazare d'Henri Cartier-Bresson, Muhammad Ali's victory over Sonny Liston de John Rooney, Earthrise de William Anders, et la photo de Don McCullin d'un marine américain choqué par un obus pendant la guerre du Viêt Nam.

Bien que les systèmes d'IA n'aient pas produit des copies exactes des images en question, les résultats (que vous pouvez consulter dans le billet de Growcoot sur PetaPixel ou en défilant vers le bas jusqu'à l'article intégré de X, anciennement Twitter) sont étrangement similaires dans de nombreux cas. L'image la plus difficile à recréer pour Midjourney et DALL-E était Derrière la gare Saint-Lazare de Cartier-Bresson, tandis que l'esthétique et le ton d'images telles que la Fille afghane et la victoire d'Ali sur Liston étaient étonnamment similaires à l'original, même s'il ne s'agissait pas de répliques exactes.

Le paysage d'Adams était probablement le plus similaire en termes de recréation exacte, tandis que Migrant Mother, Abbey Road, V-J Day in Times Square et Lunch Atop a Skyscraper étaient également très similaires à leurs contreparties créées par l'homme.

Ces représentations exactes des photos originales ont été réalisées en dépit d'invites assez détaillées, mais non spécifiques, telles que "Réalisez une image photoréaliste en noir et blanc de 1945 d'un marin embrassant une jeune fille vêtue de blanc alors qu'ils font la fête à Times Square, New York" et "Réalisez une photo dramatique en noir et blanc prise en 1942 du parc national de Grand Teton, dans le Wyoming. La rivière Snake est au premier plan et les montagnes à l'arrière-plan."

Il est également intéressant de constater que, bien que les images recréées soient toutes assez représentatives des œuvres d'art originales, chaque algorithme d'IA générative a son propre aspect. Les images de Midjourney étaient toujours plus réalistes, tandis que les images de DALL-E avaient toutes le genre de brume douce que nous attendons tous de l'IA générative - comme si les images avaient été prises avec quelque chose comme un filtre de diffusion (que vous pouvez trouver sur Amazon pour seulement 10,49 $) ou un objectif avec de la vaseline étalée sur l'avant.

Le succès de cette expérience souligne non seulement l'importance d'efforts tels que les Content Credentials de Leica, mais il soulève une fois de plus de sérieuses questions sur le rôle futur de la photographie dans les efforts documentaires et journalistiques.

Si vous souhaitez emprunter le chemin le plus long pour créer des images artistiques, découvrez le Fujifilm X-S20 sur Amazon (actuellement à 1 151 $)

Please share our article, every link counts!
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 03 > Un photographe met en évidence le champ de mines que représente l'IA générative en matière de droits d'auteur, en créant des copies convaincantes des "photos les plus emblématiques de tous les temps"
Julian van der Merwe, 2024-03- 8 (Update: 2024-03- 8)