Réunions des Tricoteuses
Retrouvez ici l'ensemble des réunions des Tricoteuses, passées et à venir.
Nous organisons une brève réunion publique en présentiel et/ou à distance, un mardi sur deux, à midi.
Copiez cette URL pour l'ajouter à votre application de calendrier préférée :
Compatible avec NextCloud, Thunderbird, DavX, Apple Calendar, Google Calendar, etc.
Prochaines réunions
Réunion bimensuelle du mardi midi
Réunions passées
Réunion bimensuelle du mardi midi
Points évoqués
- Succès du baromètre de l'application des lois avec un nombre croissant de personnes qui demandent à LexImpact des explications sur un décret.
- Premiers ajouts de liens vers les textes européens avec le projet Tricoteuses-Europe en incubation.
- Le nouveau site Tricoteuses.fr.
- Décision de supprimer https://git.tricoteuses.fr/tricoteuses/a_propos et d'intégrer son contenu dans tricoteuses.fr.
Réunion bimensuelle du mardi midi
Échanges
- Préparation de la réunion avec Open Law, en vue de leur proposer d'organiser un hackathon sur les fonctionnalités métiers que doivent avoir des serveurs juridiques (serveur MCPn, serveur d'API, etc).
Échanges
- Présentation des logiciels en cours de réalisation à partir des données Tricoteuses
Échanges
- Présentation des différents logiciels déjà réalisés à partir des données Tricoteuses
Échanges
Poursuite de la discussion sur les licences
Discussion sur les détenteurs du copyright
Présentation du logiciel Tricoteuses-Chercheuse, en cours de développement. Suite à la présentation, accord informel des participants pour en faire, à terme, le point d'entrée principal du site des Tricoteuses.
Décision d'augmenter au moins provisoirement la fréquence des réunions et de les rendre hebdomadaires.
Réunion extraordinaire consacrée aux licences des logiciels et données Tricoteuses
Aucun point particulier
Échanges
Réponse négative de la Fondation de France sur notre candidature à l'appel à projets de la Fondation de France : Libertés et démocratie numériques
Point d'avancement sur les liens vers les vidéos de l'Assemblée et du Sénat
Point d'avancement sur la détection des liens dans les textes juridiques
- Point d'avancement sur la détection des liens dans les textes juridiques
Échanges
- Point sur la réponse à l'appel à projets de la Fondation de France : Libertés et démocratie numériques
Pour pouvoir y participer, merci de communiquer votre nom et prénom, tels qu'ils figurent sur votre pièce d'identité, ainsi que votre date, ville et pays de naissance, au moins 4 jours avant la réunion.
Échanges
Point d'avancement sur l'ajout de liens dans les textes de lois, ainsi que les projets et propositions de lois
Point d'avancement sur le découpage des projets et propositions de lois en articles et en alineas
Échanges
Présentation de différents projets basés sur les outils des tricoteuses
Point d'avancement sur l'ajout de liens dans les textes de lois, ainsi que les projets et propositions de lois
Point d'avancement sur le découpage des projets et propositions de lois en articles et en alineas
Échanges
Point d'avancement sur l'ajout de liens dans les textes de lois, ainsi que les projets et propositions de lois
Point d'avancement sur le découpage des projets et propositions de lois en articles et en alineas
Travaux en cours
Nombreuses évolutions sur une merge request de Metslesliens, afin d'ajouter des liens à la dernière version du projet de loi de finances 2025
Début de documentation sur la manière d'utiliser git et Forgejo pour naviguer dans la loi et son historique
Problèmes et questions du moment
Faut-il créer un dépôt git pour chaque texte consolidé (concerne les décrets, etc) ?
Réponse : Il vaut mieux se concentrer sur l'existant avant d'élargir le périmètre des textes consolidés
Échanges
Avancées des 2 dernières semaines
Pas de problèmes détectés lors de quelques tests ponctuels sur l'historique du Code de procédure pénale
API de redirection pour trouver une page connaissant l'ID Dila de l'objet : https://legal.tricoteuses.fr/redirection/
Travaux en cours
- Étude sur la manière d'ajouter les liens manquants dans les textes des articles :
- soit en modernisant Metslesliens
- soit en utilisant un large language model open weight
Échanges
Avancées de la semaine :
Nouveaux progrés sur la génération des textes consolidés : Par exemple, il n'y a plus de textes manquants dans l'historique des commits de la Constitution.
Intégration en cours d'Open Telemetry pour tenter de palier les manques de Forgejo pour le suivi des actions.
API de redirection pour trouver une page connaissant l'ID Dila de l'objet : https://legal.tricoteuses.fr/redirection/
Communication
Retours sur les 2 premières présentations de Tricoteuses
Retours sur l'échec de soummission du message sur Hacker News
Avancées des 2 dernières semaines
Gros progrès sur la génération des textes consolidés.
Suppression de la lenteur de Forgejo pour les gros dépôts suite à la mise à jour de git (cf ticket)
Ajout des liens "Variantes" entre les différents dépôts git (consolidés, non consolidés, JSON, etc)
Installation d'un notebook Jupyter pour analyser la base de production de Tricoteuses-Légifrance (accès protégé)
Passage des SSD à 2 To pour avoir suffisamment de place pour les archives dans les dépôts git
Présentation par @LeMoussel de ses pistes de travail sur les données
Présentation de la loi sous git lors de la réunion du
groupe de travail "Forgeons !"
qui s'est tenue dans le cadre des journées Blue Hats
Avancées des 2 dernières semaines
Annonce par @LeMoussel du projet de bot Matrix sur la Constitution, basé sur de la génération augmentée de récupération (anglais : Retrieval-augmented generation, RAG) et du raisonnement par un grand modèle de langage (LLM).
Point sur l'avancement des projets Tricoteuses Sénat et Tricoteuses API Parlement, ce dernier projet proposant maintenant une API publique.
Création d'un dépôt git contenant tous les textes des bases LEGI et JORF, leurs sections et leurs articles au format Markdown, les commits étant par date de modification par la Dila. Première itération à améliorer dans les prochaines semaines.
Création d'un prototype de table des matières, permettant de naviguer dans le dépôt ci-dessus.
Communication
Préparation de la participation à la journée BlueHats « Forgeons ! »
Préparation de la participation aux journées Rules as Code
Compte-rendu d'une présentation improvisée des Tricoteuses à une réunion Ouvre boite.
Problèmes et questions du moment
Page d'accueil https://git.tricoteuses.fr/ trop lente => Erreur 503 Gateway Time-out
Affichage lent des fichiers des gros dépôts dans Forgejo, alors qu'ils sont instantanés dans GitLab (tournant sur le même serveur)
Avancées des 2 dernières semaines
Création d'un dépôt git contenant toutes les données des bases LEGI et JORF au format JSON, les commits étant par date de modification par la Dila.
(Re)création d'un dépôt git recensant les relations existantes entre les journaux officiels, les textes juridiques, leurs sections et articles, sous forme de fichiers JSON. Ces 2 dépôts étant utilisés pour générer le dépôt des fichiers Markdown.
Les bots des IA, provenant principalement d'Alibaba Cloud et Meta/Facebook, se sont relayés pour faire effondrer le site du git de la loi. Problème réglé, au moins provisoirement, en limitant le nombre de requêtes par seconde sur certaines plages IP.
Travaux en cours
Création d'un dépôt git contenant tous les textes des bases LEGI et JORF, leurs sections et leurs articles au format Markdown, les commits étant par date de modification par la Dila. Première itération incomplète : manque les sections et les liens. Ensuite regarder si cela peut servir par exemple pour voir les modifications effectuées par la Dila sur l'historique de la Constitution depuis décembre 2024.
Premières réflexions de Dorine de LexImpact sur le design du git de la loi.
Problèmes et questions du moment
Page d'accueil https://git.tricoteuses.fr/ trop lente => Erreur 503 Gateway Time-out
Affichage lent des fichiers (JSON et Markdown) dans Forgejo.
Le dépôt git, même au format bare, de l'ensemble des fichiers Markdown de la Dila peut facilement utiliser un grand nombre d'inodes sur un disque. On peut heureusement compacter efficacement le dépôt git "bare" avec
git gc.
Avancées des 2 dernières semaines
- Publication des codes juridiques, de la Constitution et de la Déclaration des Droits de l'Homme et du Citoyen de 1789, sous forme de jeux de données dans l'organisation Tricoteuses d'Hugging Face
Travaux en cours
Ajout des jeux de données Tricoteuses d'Hugging Face dans le dataset La loi sous git sur data.gouv.fr
Création d'un dépôt git recensant les relations existantes entre les journaux officiels, les textes juridiques, leurs sections et articles, sous forme de fichiers JSON. Première itération incomplète.
Création d'un dépôt git contenant tous les textes des bases LEGI et JORF, leurs sections et leurs articles au format Markdown, les commits étant par date de modification par la Dila. Première itération incomplète : manque les sections et les liens. Ensuite regarder si cela peut servir par exemple pour voir les modifications effectuées par la Dila sur l'historique de la Constitution depuis décembre 2024.
Problèmes et questions du moment
Participation à la réunion du GT «Forgeons!», consacrée au forges métiers utilisant Forgejo, le 13 mars ?
Comment préparer la présentation à Rules as Code Europe ?
Faut-il utiliser un outil comme Framadate pour fixer les dates des prochaines réunions ? Ou alors garder les réunions bimensuelles et organiser en plus des réunions avec Framadate ?
Faut-il mettre un mirroir des textes consolidés sous Git sur GitHub et réserver
Forgejo aux tickets et autres interactions ?Les références peuvent être énormes pour les textes, par exemple pour le
code du travail,
dont le README.md ne s'affiche pas. Faut-il mettre les références dans un fichier séparé,
afin de permettre au README.md de toujours s'afficher
Travaux en cours
Ajout de liens dans le texte des articles, quand on trouve avec Metslesliens des références à des textes,
sections ou articles (#6)Création d'un dépôt git contenant tous les textes et articles des bases LEGI et JORF au format Markdown,
les commits étant par date de modification par la Dila au lieu des dates de publication au JO.Présentation par JMLX de son projet de proposer divers large language models open weights
tournant soit sur une infratructure SecNumCloud française, soit on premise.Proposition de @LeMoussel de créer des datasets dans une organisation Tricoteuses sur Hugging Face.
Prototype : https://huggingface.co/datasets/Tricoteuses/codes_juridiques
Avancées des 2 dernières semaines
- Automatisation des mises à jour quotidiennes des textes de lois (#15)
- Création d'un service permettant de retrouver le chemin git d'un texte consolidé,
d'une section ou d'un article d'après son identifiant Légifrance (#13) - Ajout des références aux articles (#13)
- Utilisation de la Constitution
et du Code du travail
par Wally The Wobot : - Présentation par @BriceXYZ de son projet d'analyse des interventions des députés
Travaux en cours
- Ajout de liens dans le texte des articles, quand on trouve avec Metslesliens des références à des textes, sections ou artciles (#6)