Numérique

Les prémices d’un écosystème vertueux de l’IA dans l’édition scientifique

  • Le
  • Contenu sponsorisé - Équipements et systèmes d'informations

Un écosystème d’intelligence artificielle plus vertueux dans l’édition scientifique : c’est sur ce sujet que s’est tenue une table ronde dans le cadre des rencontres « François Gèze », organisées par le Syndicat national de l’édition et la Fédération nationale de la presse d’information spécialisée, le 28 mars 2025 au Sénat. Les débats, animés par News Tank Éducation et Recherche, ont porté sur les nouvelles opportunités et risques de cette nouvelle technologie pour le secteur. Ainsi que sur les garde-fous à renforcer ou à mettre en place, afin d’en préserver le modèle économique.

« En tant qu’éditeurs, nous sommes des acteurs engagés de l’IA », estime Guillaume Montégudet. - © Freepik
« En tant qu’éditeurs, nous sommes des acteurs engagés de l’IA », estime Guillaume Montégudet. - © Freepik

L’édition scientifique est l’un des secteurs les plus en pointe dans l’intelligence artificielle : les éditeurs sont des opérateurs, dont les contenus peuvent être intégrés - parfois de manière illégale - dans des IA. D’où des enjeux de protection particulièrement prégnants, en ce moment crucial où les IA générales, mais surtout génératives, bousculent tout particulièrement la production intellectuelle.

L’IA : de formidables opportunités pour le secteur

« L’IA est une technologie de rupture, qui va de pair avec un transfert massif de la valeur. Nous sommes donc sur un changement de paradigme, dont il faut tous nous saisir, dès maintenant », déclare Laurent Bérard-Quélin, vice-président de la Fédération nationale de la presse spécialisée et membre du Conseil supérieur de la propriété littéraire et artistique.

Guillaume Montégudet est président du Centre français d’exploitation du droit de copie. - © Hannah Assouline
Guillaume Montégudet est président du Centre français d’exploitation du droit de copie. - © Hannah Assouline

Une conviction partagée. « Pour l’édition pédagogique, l’IA représente un formidable potentiel en matière de découvrabilité des contenus (leur capacité à être repérés en ligne) par les utilisateurs », appuie Guillaume Montégudet, membre du directoire d’Humensis et président du Centre français d’exploitation du droit de copie.

La technologie permet, par ailleurs, de passer d’un contenu statique à un contenu dynamique (exercices, personnalisation), plus propice à l’assimilation. Même optimisme pour Caroline Sordet, directrice générale de Dalloz - F. Lefebvre, pour qui l’IA générative devrait suppléer à la saturation prochaine des bases de données juridiques.

Pour Laurent Le Meur, directeur d’EDRLab, un laboratoire européen de lecture numérique, l’IA peut aider aussi pour l’accessibilité du livre numérique. Pour remédier au manque de description d’image, apporter un soutien aux personnes déficientes visuelles ou cognitives, ou encore traduire automatiquement des articles scientifiques.

Des risques et défis à surmonter

Caroline Sordet est directrice générale de Dalloz - F. Lefebvre. - © D.R.
Caroline Sordet est directrice générale de Dalloz - F. Lefebvre. - © D.R.

Données et œuvres scientifiques constituent des contenus sensibles, souverains. « Que se passera-t-il si on mélange, par erreur ou par malveillance, des contenus fiables avec d‘autres qui ne le sont pas ? », interroge Caroline Sordet. Par ailleurs, la découvrabilité rime avec fort risque d’invisibilisation des sources.

Enfin, la deuxième génération d’utilisateurs, entraînée sur des contenus à 100 % générés par l’IA, devrait engendrer une perte de qualité des contenus. D’où la conclusion de Laurent Bérard-Quélin : « Nous avons besoin d’une régulation forte, sous peine de nous réveiller demain dans un monde où nous n’aurons plus notre place. »

Des protections juridiques, déjà imparfaites

La directive européenne du 17 avril 2019, transposée dans le droit français en 2021, a instauré la faculté, dite d’opt-out, pour les détenteurs de droits d’auteur, de s’opposer à ce que leurs œuvres soient utilisées dans le cadre de la fouille de textes et de données (text and data maning, ou TDM) par les IA.

Cela, à condition de le faire par des moyens faciles à interpréter par des machines (article 4). Mais la protection demeure imparfaite. « Nous nous heurtons toujours à la mauvaise volonté des grands acteurs de l’IA. De plus, le droit n’est imparable que si un éditeur est européen et héberge ses données sur un serveur européen », évoque Laurent Le Meur.

Tiphaine Vacqué, adjointe à la directrice des services et des réseaux, déléguée aux systèmes d’information et au numérique à la BNF, met en avant un autre vide juridique. « Nous mettons à disposition des chercheurs accrédités des corpus de données numériques, dans un espace physique sécurisé, témoigne-t-elle. Or, la directive TDM autorise ceux-ci à quitter l’enceinte de la BNF avec le produit de leur recherche. Que devient l’œuvre dans ce cas de figure ? »

Quels garde-fous mettre en place ?

Pour contrer l’invisibilisation des auteurs, Caroline Sordet propose plusieurs mesures. « Il nous faut réinvestir la relation avec les auteurs. Mais, aussi, continuer à créer et imprimer des produits éditoriaux. Enfin, rendre efficients lois et règlements, en mettant en place une norme commune », relève-t-elle.

Laurent Bérard-Quélin est vice-président de la Fédération nationale de la presse spécialisée. - © D.R.
Laurent Bérard-Quélin est vice-président de la Fédération nationale de la presse spécialisée. - © D.R.

De son côté, Laurent Bérard-Quélin avance : « Auteurs et éditeurs doivent travailler ensemble, car l’éditeur joue un vrai rôle fédérateur ». Une action conjointe encore compliquée. « Les éditeurs nous demandent de leur prouver que nos contenus ont été exploités », regrette-t-il.

La Fédération nationale de la presse spécialisée travaille à une proposition de modification de la loi française pour introduire un système de présomption d’utilisation des œuvres d’origine, sur simple constatation d’une réalisation « à la manière de ».

Guillaume Montégudet plaide pour qu’on n’oublie pas l’enjeu de la gestion collective. « À la clé, de vrais savoir-faire : gestion des répertoires, des certifications, des autorisations et des perceptions, mais aussi en matière de contrôle, de répartition et de sanction », énumère-t-il.

Et demain ?

Laurent Le Meur est directeur d’EDRLab. - © D.R.
Laurent Le Meur est directeur d’EDRLab. - © D.R.

« En tant qu’éditeurs, nous sommes des acteurs engagés de l’IA », réitère Guillaume Montégudet. D’ores et déjà, des parades se mettent en place face aux dangers de la technologie « Nous sommes en mesure d’identifier et de contrer un crawler en train d’absorber un contenu », indique Laurent Le Meur.

Tiphaine Vacqué ajoute : « À la BNF, nous nous basons déjà, de longue date, sur des IA - et pas seulement génératives - pour soutenir cet écosystème francophone : technologies ECR introduites dans nos chaînes de numérisation ou projets en découvrabilité, via des systèmes de reconnaissance optique. »

Laurent Bérard-Quélin prévient : « Les États illibéraux avancent, au risque de voir les bases de données nettoyées : c’est pourquoi il ne faut pas mettre tous nos œufs dans le même panier. »