
ArchéoBot : Vers une pédagogie interactive et inclusive en archéologie grâce à l'IA générative
Simiand, Guillaume, Vincenzo Capozzoli, et Alain Duplouy. « ArchéoBot : Vers une pédagogie interactive et inclusive en archéologie grâce à l'IA générative ». In Journées d'Études sur l'Intelligence Artificielle JEDDAME. Toulouse, France: Université Jean Jaurès Toulouse, 2024.
ArchéoBot : un agent conversationnel sourcé pour l'enseignement et la recherche en archéologie
En septembre 2023, en réponse à un appel à projets pédagogiques numériques de l'université Paris 1 Panthéon-Sorbonne, une équipe interdisciplinaire de deux archéologues et d'un spécialiste des humanités numériques a lancé ArchéoBot. L'outil, présenté aux journées d'études JEDDAME à Toulouse avec Vincenzo Capozzoli et Alain Duplouy, est un agent conversationnel conçu pour le domaine particulier de l'archéologie et de ses méthodes. Sa mise en service est prévue à partir de l'année universitaire 2024-2025. Il accompagne les étudiants de la licence au master dans leur travail de révision et, à terme, dans la recherche.
Le problème de départ
La transformation numérique de l'université s'accompagne d'une croissance et d'une diversification des effectifs, particulièrement sensibles en sciences humaines et sociales. Un « répétiteur automatique » disponible à toute heure semblait une réponse raisonnable, à condition de ne pas reproduire les défauts des modèles de langue généralistes : hallucinations, brièveté des réponses, et surtout absence de traçabilité de l'information. L'archéologie est une science éminemment contextuelle, dont la méthodologie et l'épistémologie sont sans cesse réévaluées par l'expérience empirique. Une réponse qui ne dit pas d'où elle vient n'y a aucune valeur. Comme l'avait rappelé la table ronde de Luxembourg de 2023 sur ChatGPT dans l'enseignement supérieur, les performances qui peuvent convaincre en mathématiques ou en informatique restent fragiles dès qu'il faut saisir les subtilités des sciences humaines.
Citer ses sources : un texte de Marc Bloch
Le cœur d'ArchéoBot, plus encore que son architecture logicielle, tient à l'obligation de citer ses sources. Pour en mesurer l'enjeu, la communication convoque un texte de Marc Bloch, prononcé en juillet 1914 lors d'une distribution des prix au lycée d'Amiens où il enseignait, bien avant l'Apologie pour l'histoire, et publié en 1950 par Lucien Febvre dans les Annales, la revue qu'ils avaient fondée ensemble en 1929 :
« Citer ses témoins, ou, comme on dit quelquefois […] "citer ses sources", est le premier devoir de l'historien. De l'historien seulement ? […] L'esprit critique, c'est la propreté de l'intelligence. Le premier devoir, c'est de se laver. »
Le grand écueil des robots conversationnels généralistes est précisément qu'ils citent rarement leurs sources, ou pire, en inventent de fictives. L'agent a si bien compris ce qu'est l'argument d'autorité qu'il s'en sert pour justifier ses réponses, sauf que nombre de ces justifications sont fausses. L'utilisateur se retrouve alors dans la peau du « crédule trop souvent trompé » de Bloch. ArchéoBot a pour ambition de tracer l'information et de renvoyer chaque réponse à une source identifiée et fiable.
L'architecture : trois idées assemblées
La nouveauté du projet tient à l'assemblage de trois idées, avancées séparément ailleurs, qui prises ensemble dépassent la somme de leurs parties.
La première est un système RAG (Retrieval-Augmented Generation), décrit en 2020, qui couple un modèle de langue à une base vectorielle. Celle-ci rassemble près de 900 documents et quelque 90 millions de signes : cours des enseignants, articles, ouvrages de référence, archives numérisées, interventions vidéo et podcasts de colloques transcrits avec des outils comme Whisper. La version complète combine une recherche par vecteurs denses (sémantique) et par vecteurs creux (mots-clés), suivie d'une étape de reclassement des documents par pertinence qui exploite le fait qu'un modèle accorde plus de poids aux premiers et aux derniers documents qu'on lui fournit.
La deuxième est l'architecture Skeleton of Thought, proposée en 2023, qui décompose une requête complexe et parallélise le traitement de ses fragments. C'est ce qui permet d'obtenir, en une à deux minutes, une réponse structurée autour d'un plan clair (définitions, analyses, exemples, résumé) plutôt que les trois phrases convenues d'un modèle non augmenté.
La troisième est l'usage de Zotero pour la gestion des sources, via son API. Le problème des systèmes RAG est qu'ils fonctionnent par défaut comme des boîtes noires, sans indication des documents utilisés, et qu'on ne peut se contenter de déposer des PDF en vrac dans un dossier pour un travail scientifique. Zotero, déjà familier à de nombreux chercheurs, leur évite d'avoir à manipuler directement la base vectorielle. L'avantage décisif est que la réponse devient auditable : un simple lien renvoie au document source. L'interface expérimentale permet de faire varier le nombre de documents et de tester divers modèles d'OpenAI et de Mistral, dont Mixtral, l'un des modèles partiellement ouverts les plus performants disponibles.
Dialoguer avec les chercheurs, vivants et morts
En 1985, à l'université de Lund, Steve Jobs espérait qu'on pourrait un jour « capturer la vision du monde d'Aristote dans un ordinateur », au point qu'un étudiant puisse non seulement lire ses mots mais lui poser une question et obtenir une réponse. Le projet a donné à cet espoir une forme plus modeste. Au-delà du corpus de référence sur les méthodes de l'archéologie (stratigraphie, technologie, typologie, à la racine de la discipline au XIXe siècle), l'équipe a voulu rendre possible un dialogue avec d'autres archéologues, du présent comme du passé.
Deux chercheurs ont été choisis. Alain Duplouy, membre du projet, dont la production en accès libre a été importée depuis son dépôt HAL et complétée par un ensemble privé de monographies. Et Francis Croissant, qui fut le maître de Duplouy à Paris 1, actif scientifiquement de 1965 à sa mort en 2019 : ne disposant d'aucun dépôt HAL, sa centaine de textes a été rassemblée en moissonnant Persée et OpenEdition, puis en océrisant des photocopies d'articles disponibles uniquement sur papier.
Ces deux corpus permettent désormais de « dialoguer » avec la pensée scientifique de ces chercheurs. L'expérience devait être éprouvée en séminaire de master : les étudiants interrogent ArchéoBot, obtiennent des réponses sourcées dans les publications, puis les critiquent. L'exercice porte autant sur le contenu archéologique que sur la manière dont le système construit ses réponses à partir des sources.
La concurrence et les questions ouvertes
À sa conception, ArchéoBot ne semblait pas avoir d'équivalent. Depuis, des outils sont apparus : GPT personnalisés, modules de ChatGPT comme ScholarAI et GPT Scholar, ou Perplexity et son Focus Academic. Ils exploitent eux aussi le RAG mais restent généralistes et adoptent une approche de « couteau suisse » qui sacrifie la spécialisation. Surtout, en s'appuyant sur les grandes bases internationales comme ArXiv ou PubMed, ils laissent dans l'invisibilité une part de la recherche en sciences humaines : des tests récents n'ont jamais retrouvé de références hébergées sur HAL, ce qui est plus préoccupant que les « biais culturels » souvent évoqués. La base spécialisée d'ArchéoBot, son approche mono-tâche et sa prise en compte des sources locales font sa valeur.
La communication ne dissimule pas les difficultés. L'océrisation des publications anciennes bute sur les polices typographiques historiques, problème qu'aborde le projet d'Antoine Doucet sur l'analyse multilingue des documents historiques. Les images archéologiques (schémas, plans topographiques, mobilier) portent un discours autonome qu'il faudra traiter par vision par ordinateur et apprentissage multimodal. La pondération des sources reste un problème non trivial : des déséquilibres de surreprésentation ont déjà été observés. La segmentation des documents longs en tokens menace de disperser le contexte. Enfin, le coût de fonctionnement, si l'on ouvre le système à des cohortes entières, impose un arbitrage entre la qualité des modèles propriétaires et l'accessibilité des modèles ouverts, dont la prochaine génération est attendue.
Une archéologie du savoir
Le nom même du projet a paru bientôt inadéquat : ArchéoBot ne se réduit ni à un robot ni à un chatbot, et le terme avait du reste déjà été employé dès 2021 par un chercheur de Rome La Sapienza, puis par l'université de Manille en 2023. La capacité du système à produire des paragraphes et des dissertations complètes le rapproche davantage des outils de rédaction automatique. Restent en suspens des questions qui débordent la pédagogie : la protection des droits d'auteur dans la fouille textuelle, et la réinvention des processus de création du savoir.
Sur ce dernier point, le détour par L'Archéologie du savoir n'est pas qu'un jeu de mots. En générant du texte sans « auteur » au sens classique, l'IA pousse à l'extrême la remise en cause foucaldienne de l'auteur comme origine du discours ; les règles encodées dans les modèles de langue ressemblent aux systèmes de contrainte qui, selon Foucault, régissent la production discursive. En établissant des connexions que les humains n'envisageraient pas, ces outils pourraient ouvrir de nouvelles ruptures dans la manière dont les savoirs sont structurés. C'est moins une réponse qu'un programme, et l'on tient peut-être là la fonction première d'une telle communication.