
Pseudonom - Le nom de personne
Pseudonom - Le nom de personne
Le dilemme de la Cour de cassation
Toutes les grandes décisions des cours suprêmes portent des noms tirés du patronyme du demandeur. Roe v. Wade, Marbury v. Madison, Costa c. ENEL.
Les arrêts célèbres ont des noms. C'est ainsi qu'on les retient, qu'on les cite, qu'on les enseigne. « L'arrêt Perruche », « l'affaire Benetton » — le nom fait la jurisprudence autant que le raisonnement.
Mais voilà : la protection de la vie privée impose désormais l'anonymisation des décisions de justice. La Cour de cassation se trouve face à un dilemme. D'un côté, préserver l'identité des justiciables. De l'autre, conserver la force normative des arrêts, leur capacité à être mémorisés, cités, discutés sous un nom distinctif.
La solution actuelle — « M. X... c/ Mme Y... » — est d'une pauvreté narrative affligeante.
Une proposition oudropienne
L'article « Casanova à la Cour de cassation », co-écrit avec Emmanuel Jeuland, explorait ce paradoxe. Le titre n'était pas qu'un jeu de mots : nous suggérions que la jurisprudence, pouvait utiliser des techniques de recombinaison de syllabes souvent employées par l'auteur de L'Histoire de ma vie.
De cette réflexion est né Pseudonom. L'idée : générer automatiquement des noms de famille français qui sonnent juste mais n'identifient personne. Des patronymes vraisemblables mais inexistants. L'anonymat par la pseudonymie.
L'algorithme du faussaire
Le corpus d'entraînement
Pour capter l'essence de l'onomastique française, il fallait un corpus large et représentatif. Le choix s'est porté sur la liste complète des conseillers municipaux de France — environ 930 000 noms, le plus gros corpus ouvert de patronymes en France que j'ai trouvé à l'époque. Cette source offre une couverture géographique complète et reflète la diversité démographique du pays.
Les chaînes de Markov
La technique est simple : une chaîne de Markov modélise les probabilités de transition entre caractères : après « Mar », quelle lettre vient le plus souvent ? Après « -tin » ? En analysant les séquences de lettres dans les vrais patronymes, on construit un modèle statistique capable de générer des noms plausibles.
Corpus : Martin, Moreau, Bernard, Durand...
Analyse : M→a→r→t→i→n, M→o→r→e→a→u...
Génération : Mortin, Dureau, Marnard...
L'ordre de la chaîne (ici 4) détermine la « mémoire » du système : combien de caractères précédents influencent le suivant. Trop court, les noms sont bizarres. Trop long, on retombe sur des patronymes existants.
Filtrage et validation
Un nom généré n'est retenu que s'il :
- fait entre 5 et 15 caractères
- n'existe pas dans le corpus d'entraînement
- respecte les règles de capitalisation (« de », « von » en minuscules, etc.)
On pourrait ajouter une vérification plus large sur les Pages blanches et/ou un filtre des combinaisons malheureuses.
Exemples de génération
Quelques patronymes produits par Pseudonom :
| Générés | | ----------- | | Berraine | | Coajourneur | | Agostilly | | Crouperal | | Brianchet | | Coupelie | | Mezaach | | Houssinier |
Chaque rafraîchissement produit un nouveau nom, unique et vraisemblable.
Applications au-delà de la Cour
La technique a des usages partout où l'on a besoin de désigner quelqu'un sans l'identifier :
- Anonymisation des décisions à tous les niveaux de juridiction
- Données de test pour les systèmes informatiques
- Pseudonymes littéraires plausibles
- Jeux et fictions nécessitant des personnages français
Postérité : la CJUE adopte la même approche
En janvier 2023, la Cour de justice de l'Union européenne a mis en place un système étrangement similaire à celui que nous proposions en 2015. Depuis cette date, toutes les affaires anonymisées reçoivent un nom fictif généré par « un générateur automatisé informatisé » qui « divise les mots en syllabes, qui sont ensuite combinées aléatoirement pour produire des noms fictifs ».
La coïncidence méthodologique est frappante : même problème (préserver la mémorabilité des arrêts malgré l'anonymisation), même solution (génération automatique de noms vraisemblables). Je n'ai pas trouvé trace d'une inspiration directe de notre article — les grands esprits se rencontrent, ou les mêmes contraintes produisent les mêmes solutions.
La CJUE dispose d'un générateur pour chaque langue officielle de l'UE. Les noms produits « ne correspondent à la véritable identité d'aucune partie » et « ne représentent en principe aucun nom existant ».
Le charme de l'inexistant vraisemblable
Pseudonom pose une question étrangement philosophique : qu'est-ce qui fait qu'un nom « sonne français » ? La réponse est statistique. Les combinaisons de lettres, leurs fréquences, leurs positions — tout cela définit un espace de possibilités dont les vrais patronymes ne sont qu'un échantillon.
Générer l'inexistant vraisemblable, c'est explorer cet espace au-delà des noms effectivement portés. C'est créer des quasi-personnes, des identités fantômes qui n'appartiennent à personne mais pourraient appartenir à n'importe qui.
En ce sens, Pseudonom est un projet typiquement oudropien : une contrainte technique (les chaînes de Markov) ouvre un espace de création (les noms possibles) pour résoudre un problème réel (l'anonymisation).
Statut
Pseudonom, développé en 2015, attend sa remise en ligne. L'application Flask originale fonctionne toujours ; il suffirait de la conteneuriser pour la déployer.
Projet développé dans le cadre d'une réflexion sur l'anonymisation des décisions de justice, présenté lors du séminaire de l'Oudropo.