Art glitch avec symboles et motifs numériques distordus – Photo by Egor Komarov on Unsplash

Identité électronique du chercheur, dépôts de données, classements. Sur quelques aspects concrets de la e-doctrine

Identité numérique
Recherche
E-doctrine
Données

Simiand, Guillaume. « Identité électronique du chercheur, dépôts de données, classements. Sur quelques aspects concrets de la e-doctrine ». Présenté à Séminaire e-doctrine, université Paris 1 Panthéon-Sorbonne, 26 octobre 2018.

Le chercheur, son ombre numérique et le village gaulois

Qui êtes-vous, sur internet ? La question peut paraître triviale à quiconque possède un profil LinkedIn et une adresse institutionnelle. Elle l'est beaucoup moins lorsqu'on s'aperçoit que la recherche française en droit, vue depuis les grands index internationaux, ressemble à un continent inconnu, un village gaulois cerné par un océan de données anglophones qu'il ignore autant qu'elles l'ignorent.

Cette communication, présentée dans le cadre du séminaire e-doctrine à Paris 1, partait d'un constat simple et un peu agaçant : nous publions, mais nous existons mal. La visibilité scientifique, longtemps déléguée aux laboratoires ou aux éditeurs, est devenue une affaire personnelle, un travail de promotion que le chercheur ne peut guère négliger s'il veut être reconnu comme spécialiste de son domaine en dehors des modes de légitimation universitaires traditionnels. Communication directe avec les pairs, possibilités de collaboration, sollicitations médiatiques : tout cela suppose d'être trouvable, et trouvable en tant que soi-même.

L'identité, ou le problème des homonymes

Le problème paraît élémentaire, et c'est pour cela qu'il est redoutable. Un PDF téléchargé sur une page personnelle circule, se détache de son auteur, vit sa vie. Un nom s'écrit de plusieurs manières, change parfois au gré d'un mariage ou d'une naturalisation. La solution existe depuis quelque temps déjà : les identifiants uniques, ces numéros stables associés à un URI qui désignent de manière courte et sans ambiguïté une publication ou un chercheur. L'ORCID (Open Researcher and Contributor ID), créé en 2009 par un consortium réunissant universités, entreprises et grands éditeurs de sciences dures comme Elsevier, Springer ou Wiley, en avait alors distribué plusieurs millions, au rythme de dizaines de milliers de nouveaux par mois. L'IdHAL remplit en France une fonction comparable. On pourrait dire, avec une pointe de malice, que c'est un peu le Minitel de l'identifiant chercheur. Les deux s'inscrivent dans l'architecture plus large de l'ISNI, lui-même normalisé par l'ISO.

Au-delà de la commodité individuelle, ces identifiants résolvent un problème structurel : celui de la multi-publication, lorsqu'un article déposé en preprint et sa version publiée dans une revue doivent rester reliés à un même auteur ; celui aussi de l'abondement automatique des applications de suivi d'activité, comme le RIBAC au CNRS. Ce n'est pas un gadget : l'Union européenne en recommande l'usage dans ses lignes directrices pour le libre accès.

Classements : un jeu de miroirs déformants

La deuxième partie de l'intervention s'aventurait sur un terrain plus épineux : les classements internationaux et les scores de citation. Les universités parisiennes, Paris 1 en tête, affichent des résultats médiocres sur les systèmes de citation calculés à partir du corpus Scopus d'Elsevier. Pourquoi ? Parce que Scopus indexe dans la catégorie « droit » des centaines de revues, pour la plupart internationales et en anglais. La recherche juridique française, vue de là, est un village gaulois dont les habitants publient dans une langue que le système ne lit pas.

La revue de droit française la mieux classée dans Scopus s'intitulait alors Médecine et droit. Ce n'est pas un hasard : il y a « médecine » dans le titre, et les sciences médicales habitent déjà le système. Le paradoxe ne manquait pas de sel : Elsevier, éditeur de Scopus, appartient au groupe RELX, ex-Reed Elsevier, au même titre que LexisNexis. De là à suggérer que les revues Lexis soient intégrées, ce qui donnerait peut-être à son principal concurrent l'envie de se faire référencer aussi, il n'y avait qu'un pas, que nous franchissions mutatis mutandis avec la prudence qui sied à ceux qui n'ont aucun pouvoir sur la question.

Le web des données, ou la bibliothèque devenue monde

La troisième partie ouvrait sur un horizon plus vaste : le web sémantique tel que l'avait imaginé Tim Berners-Lee, où chaque ressource est associée à une ontologie et reliée aux autres par des séries de triplets. L'idée, vertigineuse dans son principe, est que le web et la base de données finissent par se confondre, ce que l'on appelle parfois le web profond. Une simple requête SPARQL sur l'interface d'archives ouvertes permettait alors de compter les chercheurs disposant d'un identifiant IdHAL ; la démonstration avait le mérite de rendre tangible une infrastructure autrement abstraite.

La question qui subsistait en conclusion, et qui n'a guère perdu de son actualité, était celle de la responsabilité : qui doit gérer tout cela ? Les chercheurs eux-mêmes, déjà accaparés par leurs travaux ? Les bibliothécaires, qui ont l'expertise documentaire mais pas toujours les moyens ? La réponse, comme souvent dans les affaires humaines, se situe probablement quelque part entre les deux, dans cet espace de coopération que la e-doctrine commence à peine à dessiner.