Art glitch avec symboles et motifs numériques distordus — Photo by Egor Komarov on Unsplash

Identité électronique du chercheur, dépôts de données, classements. Sur quelques aspects concrets de la e-doctrine

Identité numérique
Recherche
E-doctrine
Données

Simiand, Guillaume. « Identité électronique du chercheur, dépôts de données, classements. Sur quelques aspects concrets de la e-doctrine ». Présenté à Séminaire e-doctrine, université Paris 1 Panthéon-Sorbonne, 26 octobre 2018.

Le chercheur, son ombre numérique et le village gaulois

Qui êtes-vous, sur internet ? La question peut sembler triviale pour quiconque possède un profil LinkedIn et une adresse institutionnelle ; elle l'est beaucoup moins quand on s'aperçoit que la recherche française en droit, vue depuis les grands index internationaux, ressemble à un continent inconnu -- un village gaulois cerné par un océan de données anglophones qu'il ignore autant qu'elles l'ignorent.

Cette communication, présentée dans le cadre du séminaire e-doctrine à Paris 1, partait d'un constat simple et agaçant : nous publions, mais nous existons mal. L'enjeu de la visibilité scientifique, longtemps délégué aux laboratoires ou aux éditeurs, est devenu une affaire personnelle, un travail de promotion que le chercheur ne peut plus se permettre de négliger s'il veut être reconnu comme spécialiste d'un domaine en dehors des modes de légitimation universitaires traditionnels. Communication directe avec les pairs, opportunités de collaboration, invitations médiatiques : tout cela suppose d'être trouvable, et d'être trouvable en tant que soi-même.

L'identité, ou le problème des homonymes

Le problème paraît élémentaire, et c'est précisément pour cela qu'il est redoutable. Un PDF téléchargé sur une page personnelle circule, se détache de son auteur, vit sa vie ; un nom s'écrit de plusieurs manières, change parfois au gré d'un mariage ou d'une naturalisation. La solution existe depuis un moment déjà : les identifiants uniques, ces numéros stables associés à un URI qui désignent de manière courte et sans ambiguïté une publication ou un chercheur. L'ORCID (Open Researcher and Contributor ID), créé en 2009 par un consortium de 111 organisations -- universités, entreprises, grands éditeurs de sciences dures comme Elsevier, Springer ou Wiley -- comptait alors plus de 5 millions d'identifiants distribués, à raison de 100 000 nouveaux par mois. L'IdHAL, lancé en 2005, remplit en France une fonction comparable ; on pourrait dire, avec une pointe de malice, que c'est un peu le Minitel de l'identifiant chercheur. Les deux s'inscrivent dans l'architecture plus large de l'ISNI, elle-même normalisée ISO.

Au-delà de la commodité individuelle, ces identifiants permettent de résoudre un problème structurel : celui de la multi-publication, quand un article déposé en preprint et sa version publiée dans une revue conservent le même DOI ; celui aussi de l'abondement automatique des applications de suivi d'activité, comme le RIBAC au CNRS. Ce n'est pas un gadget : l'Union européenne recommande officiellement l'usage de ces identifiants dans ses lignes directrices pour le libre accès.

Classements : un jeu de miroirs déformants

La deuxième partie de l'intervention s'aventurait sur un terrain plus épineux : les classements internationaux et les scores de citation. Les universités parisiennes -- Paris 1 en tête -- affichent des résultats médiocres sur les systèmes de citation calculés à partir du corpus Scopus d'Elsevier. Pourquoi ? Parce que Scopus indexe 711 revues dans la catégorie « droit », pour la plupart internationales et en anglais. La recherche juridique française, vue de là, est un village gaulois dont les habitants publient dans une langue que le système ne lit pas.

La revue de droit française la mieux classée dans Scopus s'intitulait Médecine et droit. Ce n'est pas un hasard : il y a « médecine » dans le titre, et les sciences médicales habitent déjà le système. D'ailleurs, le paradoxe ne manquait pas de sel : Elsevier, éditeur de Scopus, appartient au groupe RELX, ex-Reed Elsevier, au même titre que LexisNexis. De là à suggérer que les revues Lexis soient intégrées -- ce qui donnerait peut-être à son principal concurrent l'envie de se faire référencer aussi -- il n'y avait qu'un pas, que nous franchissions mutatis mutandis avec la prudence qui sied à ceux qui n'ont aucun pouvoir sur la question.

Le web des données, ou la bibliothèque devenue monde

La troisième partie de la présentation ouvrait sur un horizon plus vaste : le web sémantique tel que l'avait imaginé Tim Berners-Lee, où chaque ressource est associée à une ontologie et reliée aux autres par des séries de triplets. L'idée, vertigineuse dans son principe, est que le web et la base de données finissent par se confondre -- ce que l'on appelle parfois le web profond. Une simple requête SPARQL sur l'interface d'archives ouvertes permettait alors de compter le nombre de chercheurs disposant d'un identifiant IdHAL ; la démonstration avait le mérite de rendre tangible une infrastructure autrement abstraite.

La question qui subsistait en conclusion, et qui n'a guère perdu de son actualité, était celle de la responsabilité : qui doit gérer tout cela ? Les chercheurs eux-mêmes, déjà accaparés par leurs travaux ? Les bibliothécaires, qui disposent de l'expertise documentaire mais pas toujours des moyens ? La réponse, comme souvent dans les affaires humaines, se situe probablement quelque part entre les deux -- dans un espace de coopération que la e-doctrine commence à peine à dessiner.