Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style
Simiand, Guillaume. « Aperçus lexicométriques du Code civil 1804-2023 : sur quelques adverbes et une question de style ». Jurimétrie, nᵒ 3 (2024).
Le Code civil à l'épreuve des adverbes : une analyse lexicométrique (1804-2023)
Présentation du projet et de ses résultats
Intuition autour d'un café
Alors que le Code civil de 1804 est souvent cité comme un modèle de style littéraire, on entend souvent des juristes contemporains déplorer la perte de cette clarté originelle.
De ce constat informel est né le présent projet de recherche. C'est l'adverbe « notamment » qui avait lancé nos discussion.
Jugé problématique, source d'ambiguïté et perçu comme de plus en plus envahissant, cet adverbe semblait incarner à lui seul les maux de la rédaction juridique contemporaine. Mais cette impression largement partagée, ce « sentiment » d'une prolifération néfaste des adverbes, reposait-il sur une réalité tangible ? C'est pour vérifier cette intuition que le projet a été lancé : passer du ressenti à la preuve par la donnée.
Méthodologie : une approche humanités numériques
Pour objectiver ces impressions, il a fallu constituer un corpus exhaustif et inédit, s'étendant sur plus de deux siècles d'histoire législative.
La constitution du corpus (1804-2023)
L'ambition était de rassembler l'intégralité des états du Code civil depuis sa promulgation en 1804. Cette archéologie numérique a nécessité de croiser plusieurs sources :
- Légifrance pour la période contemporaine.
- Archives numériques : redécouverte et exploitation d'un CD-ROM édité par LexisNexis en 2004 pour le bicentenaire du Code civil, contenant les modifications du XIXe et XXe siècle.
Ce travail de collecte a permis de générer une série temporelle complète, avec un « instantané » du Code civil au 1er janvier de chaque année, soit 219 versions successives du texte (1805-2023).
Figure : Longueur des articles du Code civil (1805-2023). On observe l'allongement progressif des textes, notamment dans les parties récentes.
Traitement linguistique
Chaque millésime du Code a fait l'objet d'une analyse par Traitement Automatique du Langage (TAL) :
- Extraction des versions annuelles.
- Étiquetage morphosyntaxique (POS tagging) via le modèle de langue français CamemBERT et la bibliothèque spaCy.
- Isolément et catégorisation des adverbes selon les familles traditionnelles (temps, lieu, manière, etc.), choisies pour leur caractère descriptif et intelligible même si elles ne correspondent plus à la vision de l'adverbe des grammairiens d'aujourd'hui.
Résultats : surprises et nuances
L'analyse des données a révélé une réalité plus complexe que le simple sentiment de dégradation.
Le cas « notamment »
L'intuition initiale s'est révélée partiellement juste sur ce point précis. Quasi absent du Code civil originel (une seule occurrence dans la première version), l'adverbe « notamment » a connu une croissance spectaculaire, avec plus de 30 occurences dans la dernière version analysée - mais ce taux de prévalence reste modeste devant le volume du Code civil.
Figure : Fréquence relative des cinq adverbes en -ment les plus représentés, illustrant la montée en puissance de « notamment » et « également ».
Quantité vs Diversité
Contrairement à l'hypothèse d'une simple « invasion » de l'adverbe, les données montrent une réalité contre-intuitive : la fréquence globale des adverbes a baissé (passant de 4,5% à 3,3% du texte), tandis que leur diversité a explosé.
Figure : Divergence marquée entre la fréquence globale des adverbes (en baisse, courbe bleue) et leur diversité lexicale (en hausse, courbe orange).
Seule une catégorie fait exception à ce déclin général : les adverbes de manière en -ment. Eux seuls sont en augmentation constante, confirmant l'impression d'un changement de style qui reste à interpréter: moins d'habileté, plus de lourdeur? souci accru d'explicitation?
Figure : Fréquence relative des adverbes en -ment, seule catégorie en croissance structurelle sur la période.
Évolutions inattendues
L'étude a également mis en lumière le recul marqué des tournures négatives et restrictives (le couple « ne... pas », « ne... que »). Le Code moderne préfère l'affirmation à l'interdiction, l'habilitation (« peut ») à la restriction.
Figure : Ratio de fréquence des adverbes (2023/1805). Les croix indiquent la fréquence en 2023. On note l'explosion de certains termes comme « auprès » ou « notamment ».
L'analyse par catégories confirme ces tendances contrastées : alors que les adverbes de lieu et de temps (hors « notamment ») stagnent ou régressent, les adverbes de manière prennent une place prépondérante.
Figure : Ratio 2023/1805 par principales catégories d’adverbes.
Un point d'inflexion majeur a été identifié autour des années 2005-2007, coïncidant avec la diffusion du Guide de légistique de l'Assemblée nationale. Cette période semble marquer une prise de conscience et une tentative de normer l'écriture du droit.
Perspectives
Au-delà de la simple vérification d'une intuition, ce projet démontre l'intérêt d'appliquer les méthodes des humanités numériques à l'histoire du droit. Il permet de :
- Documenter l'évolution de la langue juridique sur le temps long.
- Nuancer les discours sur le « déclin » du style législatif.
- Ouvrir la voie à une analyse plus large des transformations de la normativité à travers ses marqueurs linguistiques.