Le chercheur et son ombre numérique

Qui êtes-vous, sur internet ? La question peut paraître triviale à quiconque possède un profil LinkedIn et une adresse institutionnelle. Elle l'est beaucoup moins lorsqu'on s'aperçoit que la recherche française en droit, vue depuis les grands index internationaux, ressemble à un continent inconnu.

Cette communication, présentée dans le cadre du séminaire e-doctrine à Paris 1, partait d'un constat simple et un peu agaçant : nous publions, mais nous existons mal. La visibilité scientifique, longtemps déléguée aux laboratoires ou aux éditeurs, est devenue une affaire personnelle, un travail de promotion que le chercheur ne peut guère négliger s'il veut être reconnu comme spécialiste de son domaine en dehors des modes de légitimation universitaires traditionnels. Communication directe avec les pairs, possibilités de collaboration, sollicitations médiatiques : tout cela suppose d'être trouvable, et trouvable en tant que soi-même.

L'identité, ou le problème des homonymes

Le problème paraît élémentaire, et c'est pour cela qu'il est redoutable. Un PDF téléchargé sur une page personnelle circule, se détache de son auteur, vit sa vie. Un nom s'écrit de plusieurs manières, change parfois au gré d'un mariage ou d'une naturalisation. La solution existe depuis quelque temps déjà : les identifiants uniques, ces numéros stables associés à un URI qui désignent de manière courte et sans ambiguïté une publication ou un chercheur. L'ORCID (Open Researcher and Contributor ID), créé en 2009 par un consortium réunissant universités, entreprises et grands éditeurs de sciences dures comme Elsevier, Springer ou Wiley, en avait alors distribué plusieurs millions, au rythme de dizaines de milliers de nouveaux par mois. L'IdHAL remplit en France une fonction comparable : solution bien conçue, mais nationale là où ORCID est mondial, avec le risque que cela comporte de rester entre soi. Les deux s'inscrivent dans l'architecture plus large de l'ISNI, lui-même normalisé par l'ISO.

Au-delà de la commodité individuelle, ces identifiants résolvent un problème structurel : celui de la multi-publication, lorsqu'un article déposé en preprint et sa version publiée dans une revue doivent rester reliés à un même auteur ; celui aussi de l'abondement automatique des applications de suivi d'activité, comme le RIBAC au CNRS. Ce n'est pas un gadget : l'Union européenne en recommande l'usage dans ses lignes directrices pour le libre accès.

Classements : un jeu de miroirs déformants

La deuxième partie de l'intervention s'aventurait sur un terrain plus épineux : les classements internationaux et les scores de citation. Les universités parisiennes, Paris 1 en tête, affichent des résultats médiocres sur les systèmes de citation calculés à partir du corpus Scopus d'Elsevier. Pourquoi ? Parce que Scopus indexe dans la catégorie « droit » des centaines de revues, pour la plupart internationales et en anglais. La recherche juridique française, vue de là, est un village gaulois dont les habitants publient dans une langue que le système ne lit pas.

La revue de droit française la mieux classée dans Scopus s'intitulait alors Médecine et droit. Ce n'est pas un hasard : il y a « médecine » dans le titre, et les sciences médicales habitent déjà le système. Le paradoxe ne manquait pas de sel : Elsevier, éditeur de Scopus, appartient au groupe RELX, ex-Reed Elsevier, au même titre que LexisNexis. De là à suggérer que les revues Lexis soient intégrées, ce qui donnerait peut-être à son principal concurrent l'envie de se faire référencer aussi, il n'y avait qu'un pas, que nous franchissions mutatis mutandis avec la prudence qui sied à ceux qui n'ont aucun pouvoir sur la question.

Le web des données

La troisième partie ouvrait sur un horizon plus vaste : le web sémantique tel que l'avait imaginé Tim Berners-Lee, où chaque ressource est associée à une ontologie et reliée aux autres par des séries de triplets. L'idée, vertigineuse dans son principe, est que le web et la base de données finissent par se confondre. Une simple requête SPARQL sur l'interface d'archives ouvertes permettait alors de compter les chercheurs disposant d'un identifiant IdHAL ; la démonstration avait le mérite de rendre tangible une infrastructure autrement abstraite.

Restait, en conclusion, la question de la responsabilité : qui doit gérer tout cela ? Les chercheurs eux-mêmes, déjà accaparés par leurs travaux ? Les bibliothécaires, qui ont l'expertise documentaire mais pas toujours les moyens ? En 2018, personne ne se pressait pour endosser la tâche ; à ma connaissance, personne ne se presse davantage aujourd'hui.

Identité électronique du chercheur, dépôts de données, classements. Sur quelques aspects concrets de la e-doctrine

Le chercheur et son ombre numérique

L'identité, ou le problème des homonymes

Classements : un jeu de miroirs déformants

Le web des données