Les ouvrages générés par l’IA, contenant des sources fabriquées, des faits erronés et parfois issus d’auteurs entièrement fictifs, suscitent une inquiétude croissante dans les bibliothèques et les milieux universitaires. Ces livres se retrouvent désormais même dans les bibliothèques publiques allemandes.
Écrit par Reinhard Werner
Aujourd’hui, les ouvrages documentaires générés par l’IA, contenant des erreurs et s’appuyant sur des sources fabriquées, représentent un problème croissant pour la société du savoir.
Un responsable chargé de l’« Open Science » a récemment publié un appel à l’aide à ce sujet. Fin avril, Stephan Wünsche, documentaliste spécialisé en musique à la bibliothèque universitaire de Leipzig, a publié un article intitulé « Comment vendre des inepties en ligne (rapidement) » . Il y déplore le nombre croissant d’ouvrages dans les collections des bibliothèques qui donnent l’impression d’être des ouvrages spécialisés de référence.
Documentation technique générée par l’IA présentant des lacunes de contenu alarmantes
En réalité, il s’agissait de publications générées par intelligence artificielle, présentant de graves lacunes de contenu et, dans certains cas, des auteurs fictifs. Elles provenaient souvent de plateformes d’autoédition, telles que Flip-Flop-Verlag, basée à Munich ou tredition, basée à Ahrensburg. Des ouvrages de ce type ont été retrouvés dans des bibliothèques de Leipzig, Dresde, Weimar et Hanovre, entre autres.
M. Wünsche utilise plusieurs exemples pour illustrer comment les fonds publics ont été dépensés dans des cas particuliers et ce que les bibliothèques ont acquis comme ouvrages prétendument scientifiques. Dans un ouvrage présenté comme scientifique sur Johann Sebastian Bach, son fils Johann Christian est déclaré être son père. Le texte confond également d’autres liens familiaux au sein de la famille Bach.
Un ouvrage consacré au compositeur Salomon Jadassohn mentionne les bibliothèques municipales de Leipzig comme un projet de collecte de son œuvre complète. Il affirme également qu’une grande partie du patrimoine de Jadassohn y est gérée. Ces deux affirmations sont erronées. De plus, l’auteur présumé fait référence à des sources inexistantes. Plusieurs revues spécialisées avaient déjà tiré la sonnette d’alarme concernant certains titres.
Risque potentiel pour la réputation du système scientifique
M. Wünsche part du principe que l’IA génère ces livres d’apparence scientifique dans le cadre d’un processus accéléré. La publication s’effectue ensuite via une plateforme d’autoédition. Des pseudonymes tels que « Valentin Fuchs », « Robert H. Hummel » ou « Sophia Weller » sont utilisés comme noms d’auteurs.
Les auteurs acquièrent leurs connaissances en matière de création et de commercialisation de livres grâce à des cours en ligne spécialisés. Ils vendent leurs publications via des plateformes en ligne et les catalogues des bibliothèques. Leurs revenus proviennent d’une part du prix de vente.
Pour Stephan Wünsche, le problème dépasse le simple gaspillage de fonds publics dans l’achat d’ouvrages universitaires de piètre qualité. Il craint que de nombreux étudiants ne repèrent pas les erreurs factuelles contenues dans ces livres, et que des informations erronées ne se retrouvent ainsi dans leurs travaux et leurs recherches. À terme, cela pourrait ébranler la confiance dans le système scientifique.
« tredition » promet une rectification et des contrôles plus stricts sur l’IA
Mais le flot de faux titres générés par l’IA représente également un risque pour les scientifiques reconnus. Des plateformes comme « tredition » sont aussi utilisées par de véritables chercheurs, car la publication d’ouvrages en elle-même n’engendre pas de coûts élevés. Ces coûts sont principalement liés aux services complémentaires. Après tout, eux aussi dépendent de circuits de publication abordables.
Les articles défavorables concernant des plateformes comme « tredition » pourraient inciter les bibliothèques à les considérer avec suspicion et à éviter systématiquement les ouvrages provenant de certains fournisseurs. Cela pourrait également nuire à des auteurs et universitaires reconnus.
La Bibliothèque nationale allemande recense actuellement plus de 112.000 ouvrages issus de la plateforme d’autoédition « tredition », principalement des romans et des guides pratiques. Dans un entretien accordé au journal Frankfurter Allgemeine Zeitung (FAZ), Sandra Latußeck, PDG de tredition, a annoncé son intention de mettre en place un nouvel outil de vérification. Cet outil permettra de détecter dans les publications les schémas d’intelligence artificielle, les incohérences de sources et les irrégularités de contenu.
Elle a précisé que les ouvrages cités par Stephan Wünsche « n’auraient pas dû être publiés sous cette forme ». L’auteur a depuis été interdit de publication et ses œuvres ne sont plus disponibles.
Par ailleurs, les auteurs seront désormais tenus de fournir des informations sur eux-mêmes. Les publications des deux dernières années feront l’objet d’un contrôle rétroactif.
Directeur général de ddvg : aucune influence sur la stratégie et les contenus
La Deutsche Druck- und Verlagsgesellschaft mbH (ddvg) est une société d’investissement dans les médias détenue par le Parti social-démocrate allemand (SPD). Matthias Linnekugel, directeur général de ddvg, a également souligné que les « faux livres » générés par l’IA ne constituaient « pas un élément souhaité du modèle économique ». Selon la FAZ, la société d’investissement médiatique du SPD détient 9,9 % des parts de « tredition ».
Le Frankfurter Allgemeine Zeitung (FAZ) a mentionné qu’après tout, les sociaux-démocrates sont parmi les plus fervents défenseurs d’une réglementation stricte de l’IA, incluant un étiquetage obligatoire et la lutte contre la « désinformation ». Le SPD bénéficierait également indirectement de la vente de ces faux titres. Le directeur de la société ddvg a toutefois expliqué que la participation de ddvg dans « tredition » était un investissement purement financier et que le groupe n’avait aucune influence sur la stratégie ou la gestion de l’entreprise.
[Photo: Joe Raedle/Getty Images - source : www.epochtimes.fr]
.jpeg)
