Évaluer les copies dix fois plus vite : la promesse des outils de correction automatique par l’IA

Marine Dessaux
Le mercredi 5 février 2025
Pédagogie

Alors que la correction des copies représente une charge de travail importante - et répétitive - pour les enseignants, et qu’elle devient de plus en plus difficile du fait de l’hétérogénéité des niveaux, des outils d’intelligence artificielle se développent pour accélérer cette tâche. Pour le supérieur, Gingo et PyxiScience promettent de diviser jusqu’à dix fois le temps consacré aux corrections.

Gingo et PyxiScience sont en phase d’expérimentation - © Rawpixel Ltd.

« En tant qu’enseignants, nous savons à quel point la correction de copies est un point douloureux », relève Joachim Lebovits, maître de conférences à l’Université Sorbonne Paris Nord. Avec Jacques Lévy Véhel, ancien directeur de recherche d’Inria, il a créé PyxiScience, une plateforme d’apprentissage adaptatif des mathématiques dotée d’un outil de correction automatique des copies basé sur de l’IA.

« Nous constatons que l’éventail des difficultés rencontrées par les étudiants devient de plus en plus large à cause de l’hétérogénéité croissante des niveaux. Celle-ci est devenue impossible à gérer avec le temps et les ressources dont nous disposons », expose celui qui est aujourd’hui responsable R&D IA de PyxiScience.

Un constat partagé par les équipes de Compilatio, l’outil de détection de plagiat pour les universités et grandes écoles, qui a mené une étude de marché auprès de ses utilisateurs pour comprendre leurs besoins. « Une centaine de réponses ont été recueillies et un point est ressorti très clairement  : les enseignants passent énormément de temps à corriger les évaluations. Or, il n’est pas possible d’appliquer la même attention à la première copie qu’à la dernière », résume Mélissa Toye, cheffe de produit Gingo.

Afin de réduire la charge mentale des enseignants, l’entreprise basée à Annecy a lancé le développement Gingo en juillet 2024.

La promesse de ces outils ? Corriger dix fois plus vite selon Gingo, soit 30 copies en cinq minutes, et huit fois plus vite selon les estimations de PyxiScience.

Comment ça marche ?

Concrètement, ces deux solutions analysent les réponses de l’étudiant et proposent une correction que le professeur peut ensuite modifier ou valider. L’IA soumet une réponse détaillée, question par question, sur les éléments erronés ou manquants. Là aussi, l’enseignant décide ou non de l’envoyer.

À PyxiScience, «  l’IA est entraînée sur des copies manuscrites corrigées par le professeur. Elle est capable de reproduire son style et de proposer une correction proche de ce qu’il aurait fourni  », détaille Jacques Lévy Véhel.

Pour l’heure, la plateforme concerne uniquement les élèves et étudiants, sur le continuum bac-3 à bac+3, en mathématiques. L’outil est cependant en train d’être adapté pour la physique et ses créateurs estiment qu’à condition d’avoir le temps et l’envie pour le développement, cet outil pourrait fonctionner pour toutes les disciplines scientifiques.

De son côté, Gingo cible les enseignants du secondaire et du supérieur et toutes les disciplines. Il repose sur ChatGPT. « Nous avons présenté Gingo à plusieurs établissements du supérieur, notamment en Suisse, en Guadeloupe, ainsi que dans des lycées. L’outil fonctionne sur les évaluations plus complexes du supérieur et a même été testé sur un examen de psychologie et cela s’est plutôt bien passé », indique Mélissa Toye.

PyxiScience détecte ce qui est erroné et donne la solution. - © PyxiScience

Corriger des copies manuscrites grâce à la technologie OCR

Pour l’heure, Gingo corrige les évaluations faites en ligne, mais l’ajout d’une technologie de reconnaissance optique des caractères (OCR) semble indispensable. « Nous avons eu beaucoup d’intérêt des enseignants du secondaire, notamment en histoire-géographie. Pour eux, un enjeu clé est la numérisation des copies manuscrites. Nous travaillons donc sur une fonctionnalité de reconnaissance optique de caractères qui permettra aux professeurs de scanner des copies écrites à la main afin que l’IA puisse les traiter en version numérique », partage Mélissa Toye.

PyxiScience a déjà incorporé cette fonctionnalité. La seule barrière à dépasser reste donc le fait de devoir scanner toutes les copies — plusieurs centaines dans le cas des partiels. Une étape supplémentaire, mais facilement dépassable, estime Joachim Lebovits. « Dans le secondaire, toutes les copies du baccalauréat sont scannées et c’est très rapide. C’est une tâche qui n’est pas nécessairement du ressort de l’enseignant, elle pourrait être confiée à un surveillant », suggère-t-il.

Des solutions en phase de test

Gingo est actuellement en phase bêta. «  L’un des enjeux était d’avoir des retours qualitatifs, c’est pourquoi de premiers comptes ont été ouverts en version bêta et que des ateliers pilotes réuniront une quinzaine d’enseignants, à partir de février  », précise Mélissa Toye. La commercialisation est prévue à l’été 2025.

PyxiScience a déjà déployé son outil auprès de 350 étudiants de l’Université Sorbonne Paris Nord et de l’antenne parisienne de New York University (NYU). L’objectif, d’ici la fin du semestre, est d’atteindre 3 000 étudiants. Des discussions sont en cours pour étendre l’outil à d’autres établissements d’enseignement supérieur en France et à l’international.

Permettre aux étudiants de s’exercer

Gingo veut aller plus loin en permettant aux étudiants de se corriger eux-mêmes grâce à l’IA. «  Nous voulons revoir le système de correction pour renforcer les interactions entre enseignants et étudiants  », indique Mélissa Toye.

La plateforme PyxiScience génère, elle, déjà des exercices de remédiation personnalisés. « Nous souhaitons que les étudiants puissent s’entraîner en autonomie et cela nécessite de pouvoir écrire leurs raisonnements mathématiques. Ils n’ont ensuite qu’à prendre leur feuille en photo et la télécharger sur la plateforme où la copie est corrigée », complète Joachim Lebovits.

In fine, améliorer le taux de réussite des étudiants

PyxiScience permet-il d’augmenter le taux de réussite des étudiants  ? "Il est trop tôt pour mesurer les résultats, répond Joachim Lebovits. Nous n’avons néanmoins aucun doute sur l’issue de cet essai. Nous avons été surpris de constater que, même parmi une cohorte d’étudiants en grande difficulté scolaire, le nombre d’étudiants qui utilisent Pyxiscience est élevé.

Peu de concurrence sur le supérieur

Si les outils de correction de copies automatiques se multiplient pour le secondaire, la concurrence reste limitée en France. «  Quand nous avons commencé à développer Gingo, il n’y avait pas de concurrents sur le marché français, rapporte Mélissa Toyes, uniquement des solutions américaines comme GradeAI, Emilia ou Eduaide AI. Notre valeur ajoutée repose sur la partie évaluation, là où les autres outils se concentrent sur l’amélioration du quotidien des enseignants en général comme l’envoi de mails.  »

Joachim Lebovitz est le P-DG de PixyScience. - © D.R.

Pour Joachim Lebovits, l’explication est simple :« ChatGPT est à peu près capable de corriger des copies pour le niveau secondaire, mais pas pour le supérieur. Être soi-même enseignant du supérieur aide beaucoup sur ce sujet. »

Justement, pour Gingo, faire en sorte que l’IA propose des corrections à partir de contenus fournis par l’enseignant est la prochaine étape. «  Nous travaillons sur la personnalisation de l’interface et l’ajout de documents de référence. La manière dont l’IA sera nourrie est un point clé que nous sommes en train de développer. Nous avons ajusté notre feuille de route en conséquence. À terme, nous voulons héberger notre propre modèle d’IA en interne, plutôt que de nous appuyer sur ChatGPT  », projette Mélissa Toyes.

Faire de l’IA un assistant du professeur

Comme vous le racontait Campus Matin, certains établissements du supérieur se penchent sur la rédaction de chartes IA. Ces dernières prônent une vigilance envers les outils de correction automatique.

« Nous sommes les premiers à penser et à dire que l’usage d’une IA débridée est hors de question, répond Joachim Lebovits. Sur notre plateforme, c’est toujours le professeur qui a le dernier mot. Il s’agit de créer un professeur augmenté. Nous ne recommandons pas qu’un étudiant soit isolé avec un chatbot. Le contenu, c’est nous qui le créons. »