From e16bf0fc1da62b06ce89e90b1b9250c4c7c4ec7c Mon Sep 17 00:00:00 2001
From: Joseph Gesnouin <joseph.gesnouin@dgfip.finances.gouv.fr>
Date: Fri, 12 Jan 2024 10:34:05 +0100
Subject: [PATCH] Update README.md

---
 README.md | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/README.md b/README.md
index c689f66..bd24227 100644
--- a/README.md
+++ b/README.md
@@ -4,7 +4,7 @@
     <img src="assets/logo.png" width="30%">
 </p>
 
-Ce rapport prÃ©sente LLaMAndement, un modÃ¨le de langage de pointe, optimisÃ© par le gouvernement franÃ§ais et conÃ§u pour accroÃ®tre l'efficacitÃ© et la performance du traitement des sessions parlementaires (y compris la production de notes d'audience et de documents nÃ©cessaires pour les rÃ©unions interministÃ©rielles) en gÃ©nÃ©rant des rÃ©sumÃ©s neutres des propositions lÃ©gislatives.
+Ce rapport prÃ©sente LLaMandement, un grand modÃ¨le de langage (LLM) Ã  l'Ã©tat de l'art, spÃ©cialisÃ© par les agents du Gouvernement afin d'amÃ©liorer l'efficacitÃ© du traitement des travaux parlementaires franÃ§ais (dont notamment la rÃ©daction des fiches de banc et les travaux prÃ©paratoires des rÃ©unions interministÃ©rielles) grÃ¢ce Ã  la production de rÃ©sumÃ©s neutres des projets et propositions de loi. LLaMandement est une rÃ©ponse Ã  la problÃ©matique de la gestion d'un nombre d'amendements toujours plus important par les agents de l'administration franÃ§aise. Ce projet reprÃ©sente une avancÃ©e technologique significative, en proposant une solution permettant de dÃ©passer l'efficacitÃ© et la capacitÃ© d'adaptation des agents administratifs Ã  la rÃ©alisation d'un travail toujours plus consÃ©quent et de plus en plus difficielement rÃ©alisable dans une durÃ©e limitÃ©e par un humain, tout en offrant la fiabilitÃ© et la prÃ©cision d'un rÃ©dacteur spÃ©cialisÃ©.
 
 ## Installation
 
@@ -65,12 +65,12 @@ Il est recommandÃ© de lancer le script d'entraÃ®nement dans une image Docker pou
 sh train_llamandement_13b.sh
 ```
 
-VoilÃ ! Vous Ãªtes prÃªt Ã  rÃ©-entraÃ®ner le modÃ¨le sur votre propre set de donnÃ©es. Ce processus peut prendre un certain temps, en fonction de la taille de votre ensemble de donnÃ©es et de la puissance de votre matÃ©riel.
+Vous Ãªtes prÃªt Ã  rÃ©-entraÃ®ner le modÃ¨le sur votre propre set de donnÃ©es. Ce processus peut prendre un certain temps, en fonction de la taille de votre ensemble de donnÃ©es et de la puissance de votre matÃ©riel.
 
 Concernant le rÃ©glage des paramÃ¨tres pour LORA, voici les parametres:      
 â€“ **Taux d'apprentissage (Learning Rate, LR)**: Nous avons fixÃ© le taux d'apprentissage LORA, Ïƒ = 2e-5, plus bas que les taux de fine-tuning typiques pour permettre une adaptation progressive et stable du modÃ¨le.    
 â€“ **Profondeur d'adaptation (lora_r)**: Nous avons fixÃ© sa valeur Ã  64. Ce paramÃ¨tre spÃ©cifie le rang (dimension) de la matrice de faible rang dans LoRA. Dans notre modÃ¨le LLAMA 13B, le fine-tuning avec LORA a affectÃ© environ 0,40% des poids (c'est-Ã -dire 50m de paramÃ¨tres). Cet Ã©quilibre est crucial pour obtenir une adaptabilitÃ© Ã  de nouvelles tÃ¢ches ou Ã  de nouvelles donnÃ©es tout en conservant la conception originale et les connaissances du modÃ¨le prÃ©-entraÃ®nÃ©.    
 â€“ **Taux de dÃ©croissance (Decay Rate)** : Un taux de dÃ©croissance de 0,01 a Ã©tÃ© utilisÃ© pour la rÃ©gularisation, rÃ©duisant le risque de suradaptation Ã  certaines structures de texte lÃ©gislatif.    
 â€“ **LORA Alpha (Î±)** : FixÃ© Ã  Î± = 16, ce paramÃ¨tre contrÃ´le l'Ã©chelle des ajustements LORA. Ce paramÃ¨tre est essentiel pour affiner l'impact des modifications LoRA sur le modÃ¨le, permettant un rÃ©glage plus prÃ©cis des rÃ©ponses du modÃ¨le aux nuances dans les textes lÃ©gislatifs.   
-â€“ **LORA Dropout** : Un taux d'abandon de 0,1 a Ã©tÃ© appliquÃ© aux couches LORA pour prÃ©venir la suradaptation et amÃ©liorer les capacitÃ©s de gÃ©nÃ©ralisation.      
-â€“ **Optimiseur et ordonnanceur** : Un ordonnanceur de taux d'apprentissage cosinus avec un ratio de prÃ©chauffage de 0,03 a Ã©tÃ© utilisÃ© pour optimiser le processus d'entraÃ®nement.  
\ No newline at end of file
+â€“ **LORA Dropout** : Un taux de dropout de 0,1 a Ã©tÃ© appliquÃ© aux couches LORA pour prÃ©venir la suradaptation et amÃ©liorer les capacitÃ©s de gÃ©nÃ©ralisation.      
+â€“ **Optimiseur et ordonnanceur** : Un ordonnanceur de taux d'apprentissage cosinus avec un warmup ratio de 0,03 a Ã©tÃ© utilisÃ© pour optimiser le processus d'entraÃ®nement.  
-- 
GitLab