Graphique montrant la divergence entre la fréquence relative des adverbes (en baisse) et leur nombre unique (en hausse) de 1805 à 2023

Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style

Lexicométrie
Code civil
Droit
Analyse textuelle
Légistique
Linguistique juridique
Analyse diachronique

Simiand, Guillaume. « Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style ». Jurimétrie, nᵒ 3 (2024).

Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style

Présentation du projet et de ses résultats.

Le point de départ : un soupçon d'école

Le Code civil de 1804 passe pour un monument de prose, et l'on prête volontiers à Stendhal l'habitude d'en lire quelques articles pour s'accorder le ton. À cette image canonique répond une plainte tout aussi courante chez les juristes contemporains : la langue du Code aurait perdu sa netteté première, gagnée par le bavardage et l'approximation.

L'idée de cet article est née des discussions de l'Oudropo, groupe de recherche et de création de l'université Paris 1 Panthéon-Sorbonne qui travaille, entre autres, à renouveler les approches du texte juridique. L'adverbe « notamment » y revenait comme un cas d'école. Tenu pour une source d'ambiguïté, soupçonné de proliférer, il semblait concentrer à lui seul les reproches adressés à la rédaction législative d'aujourd'hui. Restait à savoir si ce sentiment, largement partagé, reposait sur autre chose qu'une impression. C'est l'objet de l'enquête : substituer la mesure au ressenti.

Méthode : une lecture outillée

Pour mettre ces impressions à l'épreuve, il fallait d'abord un corpus, et un corpus complet : plus de deux siècles d'états successifs du même texte.

Constituer le corpus (1804-2023)

L'ambition était de réunir l'intégralité des versions du Code civil depuis sa promulgation en 1804. Le travail a supposé de croiser plusieurs sources. Légifrance couvre la période contemporaine. Pour le XIXe et le XXe siècle, on a exhumé un CD-ROM édité par LexisNexis en 2004 à l'occasion du bicentenaire du Code, qui conservait les modifications anciennes.

De ce matériau a été tirée une série temporelle continue : un « instantané » du Code au 1er janvier de chaque année, soit 219 versions successives entre 1805 et 2023.

Carte de chaleur montrant l'évolution de la longueur des articles du Code civil de 1805 à 2023 Figure : longueur des articles du Code civil (1805-2023). Les textes s'allongent au fil du temps, en particulier dans les parties récentes.

Le traitement linguistique

Chaque millésime a été soumis à un traitement automatique du langage. Après extraction des versions annuelles, le texte a fait l'objet d'un étiquetage morphosyntaxique au moyen du modèle de langue français CamemBERT et de la bibliothèque spaCy. Les adverbes ont ensuite été isolés puis répartis selon les familles traditionnelles (temps, lieu, manière, et ainsi de suite), retenues pour leur clarté descriptive, même si elles ne recouvrent plus exactement la définition que les grammairiens donnent aujourd'hui de l'adverbe.

Résultats

Les données dessinent une situation moins nette que le diagnostic de dégradation ne le laissait attendre.

Le cas de « notamment »

Sur ce point précis, l'intuition se vérifie en partie. Presque absent du Code originel, où il ne compte qu'une occurrence, « notamment » a connu une croissance forte et atteint une trentaine d'occurrences dans la dernière version étudiée. Rapporté au volume du Code, ce taux reste pourtant modeste.

Graphique montrant la fréquence relative des cinq adverbes en -ment les plus représentés Figure : fréquence relative des cinq adverbes en -ment les plus représentés, où se lit la montée de « notamment » et d'« également ».

Quantité contre diversité

Loin de confirmer l'hypothèse d'une invasion adverbiale, les chiffres montrent l'inverse. La fréquence globale des adverbes a baissé, passant de 4,5 % à 3,3 % du texte, tandis que leur diversité s'est considérablement accrue : le Code emploie proportionnellement moins d'adverbes, mais davantage d'adverbes différents.

Graphique comparant la fréquence relative des adverbes et le nombre d'adverbes uniques Figure : divergence entre la fréquence globale des adverbes (en baisse, courbe bleue) et leur diversité lexicale (en hausse, courbe orange).

Une seule catégorie échappe à ce recul : les adverbes de manière en -ment, en augmentation constante. C'est là que se loge, peut-être, le changement de style dont les juristes croient pâtir. Reste à l'interpréter : maladresse croissante, alourdissement, ou souci accru d'expliciter ?

Graphique de la fréquence relative des adverbes en -ment Figure : fréquence relative des adverbes en -ment, seule catégorie en croissance structurelle sur la période.

Quelques évolutions moins attendues

L'étude fait aussi apparaître le recul des tournures négatives et restrictives, le couple « ne... pas » et « ne... que ». Le Code récent préfère l'affirmation à l'interdiction, et l'habilitation (« peut ») à la restriction.

Graphique montrant le ratio de fréquence des adverbes entre 2023 et 1805 Figure : ratio de fréquence des adverbes (2023/1805). Les croix indiquent la fréquence en 2023. Certains termes, comme « auprès » ou « notamment », progressent fortement.

L'analyse par catégories confirme ces tendances contrastées : tandis que les adverbes de lieu et de temps (« notamment » mis à part) stagnent ou régressent, ceux de manière prennent une place grandissante.

Graphique montrant l'évolution par catégories d'adverbes Figure : ratio 2023/1805 par principales catégories d'adverbes.

Un point d'inflexion se dégage autour de 2005-2007, à la période où se diffuse le Guide de légistique. Ce moment paraît marquer une prise de conscience, et la volonté de normer l'écriture du droit.

Perspectives

Au-delà de la vérification d'une intuition, l'enquête montre l'intérêt qu'il y a à porter les méthodes des humanités numériques sur l'histoire du droit. Elle documente l'évolution de la langue juridique sur le temps long, tempère les discours sur le « déclin » du style législatif, et ouvre la voie à une étude plus ample des transformations de la normativité à travers ses marqueurs linguistiques.