« Interface de XTRL0R montrant l'extraction d'alexandrins depuis des textes juridiques »

XTRL0R - Une machine à alexandrins

poésie computationnelle
oudropo
intelligence artificielle
jurisprudence
alexandrins

XTRL0R - Une machine à alexandrins

Genèse du projet

Les minutes, mortel folâtre, sont des gangues
Qu'il ne faut pas lâcher sans en extraire l'or ! — Baudelaire, « L'horloge »

XTRL0R est une machine à extraire l'or poétique caché dans la prose la plus prosaïque. Les minutes de Baudelaire, c'est ici le temps passé (perdu ?) dans la prose, mais aussi dans un sens ancien les documents juridiques dont il faut remuer une grande quantité pour extraire l'or poétique.

J'étais tombé sur un alexandrin accidentel, un vers blanc comme on dit parfois, dans une jurisprudence de la Cour de cassation. Je savais que le volume complet des arrêts de la Cour alors publiés s'élevait à deux milliards de signes. Je rêvai aussitôt aux vers involontaires (?) qu'ils devaient recéler. Étaient-ils rares, ou au contraire abondants ? De quoi faire peut-être des recueils entiers jusque-là inaperçus ? Extraire et recomposer me semblait une voie poétique prometteuse ; plus tard, la lecture de Uncreative Writing de Kenneth Goldsmith me confirma le bien-fondé de cette approche, avec la transposition heureuse qu'il proposait du cadre théorique de l'art conceptuel vers la poésie, et l'idée de remise en jeu de corpora préexistants.

L'art de la découverte algorithmique

D'où l'idée de concevoir un algorithme capable de détecter dans la prose des séquences correspondant aux canons attendus pour des vers. Une difficulté était que la définition d'un vers recevable, notamment un alexandrin, a beaucoup changé au fil du temps ; une autre est que je suis un poéticien franchement médiocre. À ma connaissance, il n'existait pas alors d'outil conçu pour fonctionner sur un corpus « sauvage » où la syllabation de nombreux mots (sigles, noms propres...) devait être prédite.

Une approche hybride

Le système dans sa première architecture combinait deux philosophies :

L'approche classique par lexique : il s'appuie en partie sur le GLAFF, 1,3 million de mots avec segmentation syllabique, enrichi des précieux travaux du CRISCO de l'université de Caen sur les diérèses et synérèses.

L'intelligence artificielle : Pour les mots hors lexique, un modèle Seq2seq a été entraîné qui prédit le nombre de syllabes et la prononciation.

Enfin, le tout est mis en musique par un système de règles. L'ensemble ne prétend pas à l'exhaustivité ou à la perfection, ce n'est pas son objet, mais vise à détecter ~90 % des vers accidentels présents dans un corpus.

Poésie et industrie

Le pipeline final a cette physionomie :

  1. Nettoyage : Le texte brut est débarrassé de ses scories typographiques
  2. Tokenisation : Chaque mot est segmenté en unités minimales
  3. Prédiction phonétique
  4. Étiquetage prosodique : Syllabes, accents et césures sont cartographiés
  5. Extraction : Les alexandrins émergent du chaos textuel
  6. Validation : Seuls les vers respectant la métrique classique sont retenus

Les territoires explorés

7e Chambre

Premier terrain d'expérimentation, les arrêts de la Cour de cassation révèlent une poésie judiciaire inattendue. Le nom de code de cette partie du projet est « 7e chambre », ajout indispensable aux six bien existantes de la Cour de cassation. Cette septième chambre spectrale, transversale, inaperçue, est aussi la fameuse chambre du poète - au sein du palais de justice.

Autres expéditions littéraires

  • L'anausée : Le roman de J.-P. Sartre La Nausée est célèbre pour ses alexandrins blancs, volontaires ou involontaires (c'est d'ailleurs un des rares à ma connaissance où le phénomène a fait l'objet d'une publication qui m'a décidée à tester le roman avec XTRL0R). L'idée après extraction était d'anagrammiser les vers de la nausée, avec les problèmes ou inexactitudes introduits par le logiciel, qui devait ensuite s'efforcer tant bien que mal d'associer les rimes. La fin du poème, recombinée donc de manière semi-aléatoire, m'a laissé un vif souvenir, c'est un bon programme poétique :

Le soleil descendait lentement sur la mer Ce soleil et ce ciel n'étaient que tromperie J'ai dépassé le champ d'action du réverbère

L'objectif depuis, on l'aura compris, est de dépasser le champ d'action du réverbère.

  • La Recherche du temps gagné : Les romans de Proust sont notoirement trop longs
  • L'Art Total : Recomposition de sonnets à partir des rapports d'assemblées générales d'actionnaires du groupe Total
  • Les Promenades de l'algorithme solitaire : Les œuvres complètes de Rousseau revisitées - l'idée de promenade ou random walk nous mettait déjà dans l'univers des algorithmes
  • Le Tribunal fédérimes : Extraction à l'occasion d'un séminaire à Genève du corpus d'alexandrins accidentels du Tribunal fédéral suisse
  • Le cuir du créancier : à l'occasion d'une intervention au Québec, extraction des alexandrins du Code civil québécois. L'algorithme de l'époque en a trouvé 14, de quoi faire un sonnet.

Page 17 de la communication XTRL0R

Impact et réflexions

Rétrospectivement, XTRL0R posait déjà une question qui ne s'est faite que plus obsédante avec l'essor de l'intelligence artificielle : si la tâche de reconstruction du sens incombe entièrement au lecteur, quelle place pour l'auteur ? Quel type d'émotions est susceptible de susciter un texte non composé mais extrait par un auteur non humain, algorithmique, fantomatique, inexistant ? La poésie est-elle, comme les mathématiques, découverte ou composée ?

Face aux flux immenses de textes numériques et administratifs, XTRL0R — avec son orthographe inspirée du leetspeak et l’imaginaire du hacking qu’il véhicule — devient un outil d’exploration transversale et de recomposition, révélant des zones de perturbation dans un langage en ruine.

Le projet et l’écosystème d’algorithmes oudropiens qui l’entoure ont fait l’objet d’une présentation à l’Oudropo,, de Genève en 2024, sous le titre « XTRL0R, une machine à alexandrins et autres algorithmes oudropiens » ; l’occasion d’un retour sur l’ensemble du parcours algorithmique — de Pseudonom à Legislator, de la 7e chambre au Tribunal fédérimes — et sur les perspectives ouvertes par les approches sémantiques plus récentes.