Momies ressuscitées et cités antiques : le problème des images générées par l’IA | les sciences et la technologie
De récents tweets d’images représentant des « reconstitutions de personnages historiques », comme le visage de la momie de Guanche créé par une application d’intelligence artificielle (IA), ont suscité une nouvelle polémique. À tel point que Tweeter a republié l’image avec un avertissement indiquant qu’il s’agissait d’une reconstruction « non fiable ». Il a utilisé Midjourney, une application d’intelligence artificielle capable de générer des images à partir d’invites de texte. Les archéologues et les historiens ont levé un drapeau rouge, avertissant des dangers pour le patrimoine culturel posés par ces images générées par l’IA, notamment les contrefaçons historiques, le raccourcissement du processus scientifique, le renforcement des stéréotypes et les litiges en matière de droit d’auteur.
Pablo Aparicio est le co-fondateur de 3D Stoa, une entreprise qui crée des reconstitutions virtuelles du patrimoine culturel. Il dit que leur travail combine des connaissances historiques et anthropologiques avec diverses techniques de documentation pour reconstituer avec précision les origines architecturales, les œuvres d’art et les sites archéologiques. Un seul projet peut nécessiter plusieurs mois d’efforts de la part de plusieurs personnes.
Par exemple, Aparicio dit que la première étape pour reconstruire un château est un scan laser ou photogrammétrie numérique des ruines. Avec cette « base géométrique parfaite », la projection architecturale du château est créée à l’aide de logiciels informatiques tels que Blender et d’autres logiciels de rendu 3D. Nous développons des hypothèses avec des architectes et des archéologues qui nous guident à chaque étape. Nous leur montrons des résultats provisoires et ils nous disent si les murs doivent être plus hauts ou plus bas, s’ils doivent avoir un aspect différent et où un toit est nécessaire. « Ils nous donnent les détails dont nous avons besoin pour aller de l’avant », a déclaré Aparicio. « C’est un travail très précis, et nous intégrons toujours les modifications demandées par les experts qui ont commandé le travail. »
Selon Aparicio, le problème numéro un des reconstructions d’IA génératives est le manque de précision. Peu importe à quel point votre routeur est bon ou bien écrit [command] Pour concevoir un type de château précis, il est impossible d’accorder [the application] Chaque détail nécessaire pour en faire une présentation précise. » Les images générées par l’IA sont souvent accrocheuses et fonctionnent bien sur les réseaux sociaux. Malgré la belle image, c’est une fausse représentation avec suffisamment de vérité pour semer la confusion. » Ils présentent une image qui ressemble réel ou pourrait être réel. Et c’est là que réside le plus gros problème. Il promeut des falsifications historiques non scientifiques sur les réseaux sociaux qui semblent réelles ou authentiques.
Effet mélangeur
La nature générative de la technologie de l’IA est à l’origine du problème. Ces applications s’entraînent sur des ensembles de données inconnus et agissent comme un mélangeur pour produire une purée de tout ce qui est disponible sur Internet. « L’intelligence artificielle est tirée des sources les plus largement disponibles, de sorte que l’image que produira le Colisée romain ne sera pas une reconstruction complète de ce qu’elle était dans les temps anciens, mais plutôt l’arène en ruines, telle qu’elle est aujourd’hui », a déclaré Aparicio. .
Alberto Venegas, professeur d’histoire à l’Université de Murcie (Espagne), affirme que la fonction première de ces outils étant la recombinaison, ils réaffirment les stéréotypes et perpétuent les idées fausses sur le passé. « Les images ne ressemblent même pas à distance au passé. C’est un mélange colossal de chaque image qui se trouve, indépendamment de la source, du but ou de l’auteur. Cela perpétue les mythes populaires et les images que nous avons l’habitude de voir dans les médias. »
Par exemple, Venegas cite la « représentation impressionnante » de Paris pendant la Révolution française Du point de vue de la caméra GoPro largement diffusée sur les réseaux sociaux. Tout historien verra que Paris dans ces images n’est pas de la période révolutionnaire, dit Venegas, mais plutôt d’un mélange des périodes du Second Empire français et de la Troisième République. Cependant, dans l’imaginaire collectif, il y a des éléments parisiens tels que les toits en ardoise, les cheminées, les grandes entrées, les bâtiments en pierre et les grands boulevards. « Paris au 18ème siècle n’était pas comme ça. Cela est venu plus tard, après plusieurs projets de rénovation de la ville. De même, l’image représente le drapeau français moderne, pas le drapeau utilisé à l’époque. »
Le programme AI a réuni tous les éléments raisonnables qui nous font penser à la Révolution française parce que nous l’avons vu à la télévision, dans les jeux vidéo et dans les films. « J’appelle cela l’histoire des médias et la mémoire esthétique parce qu’elle évoque une image inexacte de cette époque », a déclaré Venegas.
L’intelligence artificielle peut-elle être utilisée pour reconstruire une image plausible du patrimoine culturel ? Venegas le pense. « Si vous fournissez au programme les données correctes », a-t-il déclaré, « cela peut se rapprocher des reconstructions d’experts ». Professeur mentionnéSuivant RembrandtUn projet du designer néerlandais Bas Corsten avec l’université de technologie de Delft (Pays-Bas) et le musée Rembrandtweis. Le projet a rassemblé 170 000 images d’œuvres du peintre néerlandais Rembrandt et a utilisé cette base de données pour créer une œuvre presque parfaite qui reproduit le style et le coup de pinceau distinctifs de l’artiste. .
Clever Reconstruction soulève également des problèmes de droit d’auteur car il capture le travail de milliers de photographes, illustrateurs, designers et artistes. Ces outils restent non réglementés alors que les débats sur le plagiat et la violation du droit d’auteur font rage.
Bien que Venegas et Aparicio critiquent l’utilisation de ces outils pour une reconstruction complète du patrimoine culturel, ils conviennent qu’ils sont utiles pour de petites parties du processus traditionnel, comme le choix des textures de surface et d’autres finitions. Venegas dit que cela pourrait être utile dans les milieux éducatifs. Les écoles et les universités peuvent les utiliser dans des activités telles que la réflexion, la critique et les discussions sur diverses images de différentes périodes. Ce sont des utilisations positives du processus éducatif.
abonnement Pour notre newsletter hebdomadaire pour plus de couverture de l’actualité en anglais d’EL PAÍS USA Edition