ArchéoBot, un « logoscope » archéologique

Communication « A new way of teaching archaeology through generative AI », présentée à Interfaceing 2024 (National Taiwan University) avec Vincenzo Capozzoli et Alain Duplouy.

ArchéoBot, agent conversationnel sourcé conçu à l'université Paris 1 Panthéon-Sorbonne, a d'abord été pensé comme un répétiteur pour les étudiants. Son architecture — RAG, « squelette de pensée », gestion bibliographique par Zotero et obligation de citer ses sources — est détaillée dans Archéo-Bot, le chatbot. Cette communication en tire une idée plus ambitieuse : faire de l'outil un logoscope, un instrument pour observer et interroger le discours (logos) d'un savant à travers l'ensemble de ses écrits.

Dialoguer avec les savants, vivants et morts

My hope is someday, we can capture the underlying worldview of Aristotle — in a computer. And someday, some student will be able not only to read the words Aristotle wrote, but ask him a question — and get an answer.

— Steve Jobs, Lund University, 1985

Deux problèmes se posaient aux enseignants-chercheurs à l'origine du projet : offrir aux étudiants un ensemble documentaire fiable, et susciter un dialogue avec ces sources, c'est-à-dire avec d'autres archéologues, du présent comme du passé. Le savant vivant — l'enseignant-chercheur — transmet, mais n'est pas disponible à toute heure, et n'atteint que les étudiants inscrits à un moment donné. Le savant mort, lui, a laissé une œuvre qui garde sa valeur, ne serait-ce que pour des raisons historiographiques. Comment lui redonner voix ?

Deux corpus ont servi de banc d'essai. Celui d'Alain Duplouy, membre du projet, importé depuis son dépôt HAL et complété par des monographies. Et celui de Francis Croissant, son maître à Paris 1, actif de 1965 à sa mort en 2019 : sans aucun dépôt HAL, sa centaine de textes a été rassemblée en moissonnant Persée et OpenEdition, puis en océrisant des photocopies d'articles disponibles seulement sur papier. Les deux ensembles permettent désormais de « dialoguer » avec la pensée de ces chercheurs — dialogue destiné à un séminaire de master, où les étudiants interrogent l'agent, obtiennent des réponses sourcées, puis les critiquent.

Une question qui déborde la pédagogie

Faire parler le corpus d'un savant déplace le geste d'enseignement vers celui de la recherche, et soulève des questions que la pédagogie seule n'épuise pas : la visibilité des travaux hébergés sur HAL, souvent introuvables pour les outils généralistes adossés à arXiv ou PubMed ; la protection des sources dans la fouille textuelle ; et la place d'un « auteur » dans un texte produit par l'agrégation de milliers de pages. Autant de chantiers ouverts, que la page de référence recense du côté technique.

A new way of teaching archaeology through generative AI: the archaeological « logoscope » of the Paris 1 Panthéon-Sorbonne University

ArchéoBot, un « logoscope » archéologique

Dialoguer avec les savants, vivants et morts

Une question qui déborde la pédagogie