Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style
Simiand, Guillaume. « Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style ». Jurimétrie, nᵒ 3 (2024).
Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style
Présentation du projet et de ses résultats.
Le point de départ : un soupçon d'école
Le Code civil de 1804 passe pour un monument de prose, et l'on prête volontiers à Stendhal l'habitude d'en lire quelques articles pour s'accorder le ton. À cette image canonique répond une plainte tout aussi courante chez les juristes contemporains : la langue du Code aurait perdu sa netteté première, gagnée par le bavardage et l'approximation.
L'idée de cet article est née des discussions de l'Oudropo, groupe de recherche et de création de l'université Paris 1 Panthéon-Sorbonne qui travaille, entre autres, à renouveler les approches du texte juridique. L'adverbe « notamment » y revenait comme un cas d'école. Tenu pour une source d'ambiguïté, soupçonné de proliférer, il semblait concentrer à lui seul les reproches adressés à la rédaction législative d'aujourd'hui. Restait à savoir si ce sentiment, largement partagé, reposait sur autre chose qu'une impression. C'est l'objet de l'enquête : substituer la mesure au ressenti.
Méthode : une lecture outillée
Pour mettre ces impressions à l'épreuve, il fallait d'abord un corpus, et un corpus complet : plus de deux siècles d'états successifs du même texte.
Constituer le corpus (1804-2023)
L'ambition était de réunir l'intégralité des versions du Code civil depuis sa promulgation en 1804. Le travail a supposé de croiser plusieurs sources. Légifrance couvre la période contemporaine. Pour le XIXe et le XXe siècle, on a exhumé un CD-ROM édité par LexisNexis en 2004 à l'occasion du bicentenaire du Code, qui conservait les modifications anciennes.
De ce matériau a été tirée une série temporelle continue : un « instantané » du Code au 1er janvier de chaque année, soit 219 versions successives entre 1805 et 2023.
Figure : longueur des articles du Code civil (1805-2023). Les textes s'allongent au fil du temps, en particulier dans les parties récentes.
Le traitement linguistique
Chaque millésime a été soumis à un traitement automatique du langage. Après extraction des versions annuelles, le texte a fait l'objet d'un étiquetage morphosyntaxique au moyen du modèle de langue français CamemBERT et de la bibliothèque spaCy. Les adverbes ont ensuite été isolés puis répartis selon les familles traditionnelles (temps, lieu, manière, et ainsi de suite), retenues pour leur clarté descriptive, même si elles ne recouvrent plus exactement la définition que les grammairiens donnent aujourd'hui de l'adverbe.
Résultats
Les données dessinent une situation moins nette que le diagnostic de dégradation ne le laissait attendre.
Le cas de « notamment »
Sur ce point précis, l'intuition se vérifie en partie. Presque absent du Code originel, où il ne compte qu'une occurrence, « notamment » a connu une croissance forte et atteint une trentaine d'occurrences dans la dernière version étudiée. Rapporté au volume du Code, ce taux reste pourtant modeste.
Figure : fréquence relative des cinq adverbes en -ment les plus représentés, où se lit la montée de « notamment » et d'« également ».
Quantité contre diversité
Loin de confirmer l'hypothèse d'une invasion adverbiale, les chiffres montrent l'inverse. La fréquence globale des adverbes a baissé, passant de 4,5 % à 3,3 % du texte, tandis que leur diversité s'est considérablement accrue : le Code emploie proportionnellement moins d'adverbes, mais davantage d'adverbes différents.
Figure : divergence entre la fréquence globale des adverbes (en baisse, courbe bleue) et leur diversité lexicale (en hausse, courbe orange).
Une seule catégorie échappe à ce recul : les adverbes de manière en -ment, en augmentation constante. C'est là que se loge, peut-être, le changement de style dont les juristes croient pâtir. Reste à l'interpréter : maladresse croissante, alourdissement, ou souci accru d'expliciter ?
Figure : fréquence relative des adverbes en -ment, seule catégorie en croissance structurelle sur la période.
Quelques évolutions moins attendues
L'étude fait aussi apparaître le recul des tournures négatives et restrictives, le couple « ne... pas » et « ne... que ». Le Code récent préfère l'affirmation à l'interdiction, et l'habilitation (« peut ») à la restriction.
Figure : ratio de fréquence des adverbes (2023/1805). Les croix indiquent la fréquence en 2023. Certains termes, comme « auprès » ou « notamment », progressent fortement.
L'analyse par catégories confirme ces tendances contrastées : tandis que les adverbes de lieu et de temps (« notamment » mis à part) stagnent ou régressent, ceux de manière prennent une place grandissante.
Figure : ratio 2023/1805 par principales catégories d'adverbes.
Un point d'inflexion se dégage autour de 2005-2007, à la période où se diffuse le Guide de légistique. Ce moment paraît marquer une prise de conscience, et la volonté de normer l'écriture du droit.
Perspectives
Au-delà de la vérification d'une intuition, l'enquête montre l'intérêt qu'il y a à porter les méthodes des humanités numériques sur l'histoire du droit. Elle documente l'évolution de la langue juridique sur le temps long, tempère les discours sur le « déclin » du style législatif, et ouvre la voie à une étude plus ample des transformations de la normativité à travers ses marqueurs linguistiques.