Illustration du chatbot Archéo-Bot

Archéo-Bot, le chatbot

Archéologie
IA
Chatbot
Pédagogie

Capozzoli, Vincenzo, Alain Duplouy, François Giligny, et Guillaume Simiand. « Archéo-Bot, le chatbot ». La collection numérique, IA et Enseignement Supérieur : quels enjeux et impacts ?, 30 (décembre 2023): 48‑49.

Archéo-Bot, le chatbot

En septembre 2023, répondant à un appel à projets pédagogiques numériques de notre université, nous nous sommes posé une question qui peut sembler naïve mais qui s'avère redoutable dès qu'on la prend au sérieux : peut-on construire un agent conversationnel qui cite ses sources ? La question n'est pas technique — on sait faire dialoguer un modèle de langue avec une base de données. Elle est épistémologique. Car un chatbot qui ne dit pas d'où il tient ce qu'il affirme reproduit exactement le travers que Marc Bloch dénonçait en 1914 devant ses élèves du lycée d'Amiens : l'absence de « propreté de l'intelligence ».

C'est le point de départ d'ArchéoBot, projet mené avec Vincenzo Capozzoli, Alain Duplouy et François Giligny, et présenté ici dans un numéro de La collection numérique consacré aux enjeux de l'IA dans l'enseignement supérieur.

Le constat

Les LLM grand public — ChatGPT en tête — posent un problème spécifique aux sciences humaines. En mathématiques ou en informatique, on peut vérifier une réponse par le calcul ; en archéologie, en histoire, en littérature, la vérification passe par le retour aux sources, et les sources sont contextuelles, dispersées, parfois contradictoires. Or ChatGPT, quand il ne se contente pas de réponses trop brèves, invente des références bibliographiques avec un aplomb qui forcerait l'admiration si la chose n'était pas si préoccupante. Comme l'ont relevé Caroline Muller et Frédéric Clavert lors de la table ronde luxembourgeoise de 2023, les performances des LLM généralistes restent très limitées dès qu'on sort des domaines formalisables.

ArchéoBot part du principe inverse : chaque paragraphe de réponse doit renvoyer à un document identifié et vérifiable. Le dispositif s'appuie sur une base de 900 documents — cours magistraux, articles, ouvrages, archives numérisées, vidéos de colloques transcrites via Whisper — représentant quelque 90 millions de signes, le tout indexé et géré via Zotero.

Trois briques, une idée

L'architecture combine trois approches. Un système RAG (Retrieval-Augmented Generation), d'abord, qui apparie le modèle de langue à une base vectorielle pour ancrer les réponses dans le corpus. Une architecture Skeleton of Thought ensuite, qui décompose les requêtes en sous-tâches parallélisées — ce qui permet de produire des réponses structurées et détaillées en une à deux minutes, là où un LLM classique donnerait trois phrases vagues. L'intégration de Zotero enfin, qui transforme la gestion des sources en une opération familière pour les chercheurs, sans qu'ils aient à manipuler directement la base vectorielle.

L'assemblage de ces trois briques — avancées séparément dans la littérature — nous semblait dépasser la somme des parties. La réponse produite est auditable : l'enseignant ou l'étudiant accède aux documents source d'un simple clic.

Un article bref, des questions longues

Le format de cette publication — deux pages dans La collection numérique — impose la concision. Nous y présentons le projet, ses principes, son architecture et ses premiers usages. Les questions ouvertes, elles, sont plus volumineuses que les réponses : coût de fonctionnement pour des cohortes entières d'étudiants, pondération des sources dans la base, segmentation optimale des documents longs, intégration des images archéologiques (schémas, plans, mobilier) qui constituent souvent un discours autonome non explicité dans le texte. Ces problèmes ne sont pas résolus. Nous avons au moins essayé de les poser honnêtement.