diff --git a/Fuzzy_attrib/functions.py b/Fuzzy_attrib/functions.py
new file mode 100644
index 0000000000000000000000000000000000000000..0616c3dfdd002f28f5595197aa6ac5baacf217b8
--- /dev/null
+++ b/Fuzzy_attrib/functions.py
@@ -0,0 +1,1195 @@
+import glob
+import numpy as np
+import pandas as pd
+import re
+import os
+import codecs
+from PyPDF2 import PdfReader
+import PyPDF2
+import glob
+import shutil
+from rapidfuzz import process, fuzz,distance
+from tqdm import tqdm
+import io,sys
+import builtins
+import logging
+from collections import Counter
+import json
+import rapidfuzz
+from collections import Counter
+#import Compare_texts
+
+
+logger = logging.getLogger('ErrorLogger')
+# Configure logger to write to a file...
+
+def my_handler(type, value, tb):
+    logger.exception("Uncaught exception: {0}".format(str(value)))
+
+# Install exception handler
+sys.excepthook = my_handler
+
+def print(*args, **kwargs):
+    """
+    Une version personnalisÃ©e de la fonction print qui Ã©crit Ã©galement la sortie dans un fichier de log.
+    """
+    log_file = open("../logs.txt","a",encoding="utf-8")
+    sep = kwargs.get("sep", " ")
+    end = kwargs.get("end", "\n")
+    file = kwargs.get("file",log_file)
+    print_str = sep.join([str(arg) for arg in args]) + end
+    file.write(print_str)
+    file.flush()
+    builtins.print(*args,**kwargs)
+    
+    
+    
+def identifier_document_type(plf_a_trier_location):
+    """
+    Identifie le type de document en tentant de lire une liasse soit de l'AssemblÃ©e Nationale (AN),
+    soit du SÃ©nat, en utilisant leur format spÃ©cifique de lecture.
+
+    Args:
+        plf_a_trier_location (str): Le chemin d'accÃ¨s au document Ã  identifier.
+
+    Returns:
+        tuple: Contient le dictionnaire des donnÃ©es lues et le type de document identifiÃ© ("AN", "SENAT", ou "null" si non identifiÃ©).
+    """
+    doc_type = "null"
+    d = None
+
+    # Essayer de lire comme une liasse de l'AssemblÃ©e Nationale
+    try:
+        d = read_liasse(plf_a_trier_location)
+        print("Le document est une liasse de l'AssemblÃ©e Nationale.")
+        doc_type = "AN"
+    except Exception as e:
+        print("Le document n'est pas une liasse de l'AssemblÃ©e Nationale.")
+        print(e)
+
+        # Si Ã©chouÃ©, essayer de lire comme une liasse du SÃ©nat
+        try:
+            d = read_liasse_senat(plf_a_trier_location)
+            print("Le document est une liasse du SÃ©nat.")
+            doc_type = "SENAT"
+        except Exception as e:
+            print("Le document n'est pas une liasse du SÃ©nat.")
+            print(e)
+
+    return d, doc_type
+    
+    
+def get_attrib_score(attributed,nattributed):
+    """
+    Affiche le nombre d'amendements dÃ©jÃ  triÃ©s, le nombre d'amendements Ã  trier,
+    et calcule le score d'attribution.
+
+    Cette fonction calcule et affiche le score d'attribution basÃ© sur le ratio entre
+    le nombre d'amendements dÃ©jÃ  attribuÃ©s et le total d'amendements (attribuÃ©s et non attribuÃ©s).
+
+    Args:
+        attributed (DataFrame): DataFrame contenant les amendements dÃ©jÃ  attribuÃ©s.
+        nattributed (DataFrame): DataFrame contenant les amendements non attribuÃ©s.
+
+    Affiche le nombre d'amendements dans chaque catÃ©gorie et le score d'attribution.
+    """
+    print(str(np.shape(attributed)[0]) + " amendements dÃ©jÃ  triÃ©s")
+    print(str(np.shape(nattributed)[0])+" amendements Ã  trier")
+    print("score d'attribution :"+ str(np.shape(attributed)[0]/(np.shape(nattributed)[0]+np.shape(attributed)[0])))
+    
+def remplacement(match):
+    """
+    Remplace les espaces dans une chaÃ®ne capturÃ©e par une expression rÃ©guliÃ¨re.
+    Args:
+        texte (str): La chaÃ®ne de caractÃ¨res Ã  filtrer.
+
+    Returns:
+        str: La chaÃ®ne rÃ©sultante ne contenant que des chiffres.
+    """
+    return match.group(1) + re.sub(r'\s+', '', match.group(2))
+
+def garder_seulement_chiffres(texte): 
+    """
+    Supprime tous les caractÃ¨res non numÃ©riques d'une chaÃ®ne de caractÃ¨res.
+    """
+    return re.sub(r'\D', '', texte)
+
+
+def uniformiser_numero(texte):
+    """
+    Uniformise le format des numÃ©ros dans une chaÃ®ne de caractÃ¨res issue de l'extraction des liasses AN ou Senat. Le but du jeu est de toujours finir avec un amendement rÃ©fÃ©rencÃ© de la sorte: NÂ° I-numero
+
+    Cette fonction effectue plusieurs remplacements et nettoyages pour standardiser
+    le format des numÃ©ros mentionnÃ©s dans le texte. Les Ã©tapes incluent la conversion
+    des abrÃ©viations "(NÂ°" en "(NumÃ©ro", la standardisation du prÃ©fixe des numÃ©ros,
+    et l'unification des formats de numÃ©rotation pour les suivis de certains prÃ©fixes spÃ©cifiques.
+
+    Args:
+        texte (str): La chaÃ®ne de caractÃ¨res contenant les numÃ©ros Ã  uniformiser.
+
+    Returns:
+        str: La chaÃ®ne de caractÃ¨res avec les numÃ©ros uniformisÃ©s.
+
+    Les modifications effectuÃ©es sont :
+    - Remplacement de "(NÂ°" par "(NumÃ©ro".
+    - Ajout d'un prÃ©fixe "I-" devant les numÃ©ros qui sont prÃ©cÃ©dÃ©s de "NÂ° " et 
+      Ã©ventuellement de "CF", suivi directement par des chiffres.
+    - Uniformisation du format de numÃ©rotation pour une liste spÃ©cifiÃ©e de prÃ©fixes de comissions
+      (par exemple, "AS", "AC", "CF", etc.) en les remplaÃ§ant tous par "I-" suivi des chiffres.
+    - Remplacement des prÃ©fixes "II-" et "III-" par "I-" pour les numÃ©ros prÃ©cÃ©dÃ©s de "NÂ° ".
+    """
+    # Remplacer les occurrences de "(NÂ°" par "(NumÃ©ro"
+    texte = re.sub(r'\(NÂ°', '(NumÃ©ro', texte)
+    
+    texte = re.sub(r'NÂ° \s*(CF)?(\d+)', r'NÂ° I-\1\2', texte)
+
+    # Uniformiser le format du numÃ©ro pour "NÂ° ..."
+    texte = re.sub(r'NÂ°\s*(I+-CF|I+|CF|I-CF|AS|AC|CE|CS|I-AS|I-AC|I-CE|I-CS)?(\d+)', r'NÂ° I-\2', texte)
+
+    # Remplacer ensuite les prÃ©fixes "II-" et "III-" par "I-"
+    texte_uniforme = re.sub(r'NÂ° I{2,3}-', 'NÂ° I-', texte)
+
+    return texte_uniforme
+
+def read_liasse(liste_doc):
+    """
+    Lit une sÃ©rie de documents PDF listÃ©s dans un rÃ©pertoire et extrait le texte associÃ© Ã  chaque amendement.
+
+    Cette fonction parcourt les fichiers PDF spÃ©cifiÃ©s dans le chemin fourni par `liste_doc`, extrait le texte de chaque page,
+    et assemble le texte de chaque amendement. Chaque amendement est identifiÃ© par un numÃ©ro unique extrait du nom du fichier
+    et potentiellement par des indicateurs dans le texte. Le texte extrait est ensuite stockÃ© dans un dictionnaire avec le numÃ©ro
+    d'amendement comme clÃ©.
+
+    Args:
+        liste_doc (str): Le chemin vers le rÃ©pertoire contenant les fichiers PDF Ã  lire. Le chemin doit se terminer par
+                         le nom du rÃ©pertoire, sans wildcard pour les fichiers (la fonction ajoute "\\*.pdf" pour trouver
+                         tous les PDF dans le rÃ©pertoire).
+
+    Returns:
+        dict: Un dictionnaire oÃ¹ les clÃ©s sont les numÃ©ros des amendements (int) et les valeurs sont le texte complet (str)
+              de chaque amendement extrait des fichiers PDF.
+
+    Le processus inclut l'uniformisation des numÃ©ros d'amendement dans le texte pour faciliter leur identification, ainsi que
+    la gestion des cas oÃ¹ le texte d'un amendement s'Ã©tend sur plusieurs pages. La fonction imprime Ã©galement des informations
+    de suivi pendant son exÃ©cution, telles que le nom du document actuellement traitÃ© et le nombre d'amendements traitÃ©s.
+    """
+    liste_doc = glob.glob(liste_doc+"\\*.pdf")
+
+    k = [int(docname.split("\\")[-1].split(" ")[4]) for docname in liste_doc]
+    liste_amendements, num_init, d = [], 1, {}
+
+    for j in list(np.argsort(k)):
+        docname = liste_doc[j]
+        print(f"Traitement du document : {docname}")
+        reader = PyPDF2.PdfReader(docname)
+        num_init = int(docname.split("\\")[-1].split(" ")[4])
+        print(f"NumÃ©ro initial de l'amendement : {num_init}")
+        print(f"Nombre actuel d'amendements traitÃ©s : {len(liste_amendements)}")
+        text = ""
+        # ItÃ©rer sur chaque page du document PDF avec une barre de progression
+        for i in tqdm(range(len(reader.pages))):
+            # PrÃ©-traitement du texte de la page suivante pour dÃ©tecter les changements d'amendements
+            if i != len(reader.pages) - 1:  # Si ce n'est pas la derniÃ¨re page
+                next_page_text = reader.pages[i + 1].extract_text().replace("N o", "NÂ°")
+                # Appliquer l'uniformisation et le remplacement des numÃ©ros sur le texte de la page suivante
+                correction = uniformiser_numero(re.sub(r'(NÂ° I-.*?)((?:\s+\d+)+)', remplacement, next_page_text))
+
+            # Extraire et uniformiser le texte de la page actuelle
+            current_page_text = uniformiser_numero(reader.pages[i].extract_text())
+            text += current_page_text  # ConcatÃ©ner le texte Ã  la variable accumulatrice 'text'
+
+            # VÃ©rifier si le numÃ©ro d'amendement actuel ne figure pas dans le texte de la page suivante
+            # Indiquant la fin de l'amendement actuel et le dÃ©but d'un nouveau
+            if i != len(reader.pages) - 1 and f"NÂ° I-{num_init}" not in correction:
+                d[num_init] = text  # Assigner le texte accumulÃ© Ã  l'amendement actuel
+                text = ""  # RÃ©initialiser le texte pour le prochain amendement
+                # Mise Ã  jour de num_init pour le prochain amendement basÃ© sur le texte de correction
+                num_init = int(garder_seulement_chiffres(re.sub(r'\D', '', correction[correction.find("NÂ° I-")+5:correction.find("NÂ° I-")+9])))
+            elif i == len(reader.pages) - 1:  # Pour la derniÃ¨re page, assigner le texte restant
+                d[num_init] = text
+                num_init += 1  # PrÃ©parer num_init pour un potentiel usage futur
+    return(d)
+
+def read_liasse_senat(liste_doc_path):
+    """
+    Lit et traite les documents PDF de liasses du SÃ©nat situÃ©s dans un rÃ©pertoire spÃ©cifiÃ©,
+    en extrayant et nettoyant le texte de chaque page, et en regroupant ce texte par numÃ©ro d'amendement.
+
+    La fonction parcourt tous les fichiers PDF dans le rÃ©pertoire donnÃ©, nettoie le texte extrait pour uniformiser
+    certaines chaÃ®nes de caractÃ¨res, et regroupe le texte par amendement en se basant sur la dÃ©tection de numÃ©ros
+    d'amendement uniques dans le texte.
+
+    Args:
+        liste_doc_path (str): Le chemin du rÃ©pertoire contenant les documents PDF Ã  lire.
+
+    Returns:
+        dict: Un dictionnaire oÃ¹ chaque clÃ© est un numÃ©ro d'amendement (int) et chaque valeur est le texte (str)
+              associÃ© Ã  cet amendement, nettoyÃ© et concatÃ©nÃ© Ã  partir des pages du document PDF.
+    """
+    # DÃ©finir les chemins vers les documents PDF
+    liste_doc = glob.glob(f"{liste_doc_path}\\*.pdf")
+
+    # Fonction interne pour nettoyer et prÃ©parer le texte extrait
+    def clean_and_prepare_text(text):
+        replacements = {
+            "II-": "I-", "NÂ° FINC.": "NÂ° I-", "nÂ° FINC.": "NÂ° I-", 
+            "A M E N D E M E N T": "AMENDEMENT", "_________________": "------", 
+            "Suite amdt NÂ° I-": "", "Suite amd NÂ° I-": "", "OBJET": "Objet"
+        }
+        for old, new in replacements.items():
+            text = text.replace(old, new)
+        return text
+
+    # Fonction interne pour extraire un numÃ©ro d'amendement Ã  partir du texte
+    def extract_amendment_number(text):
+        match = re.search(r'NÂ° I-(\d+)', text)
+        return int(match.group(1)) if match else None
+
+    d = {}
+    for docname in tqdm(liste_doc):
+        print(f"Traitement du document : {docname}")
+        reader = PyPDF2.PdfReader(docname)
+        text_accumulator = ""
+        num_init = None
+
+        for i, page in enumerate(reader.pages):
+            current_text = clean_and_prepare_text(page.extract_text())
+            
+            # Mise Ã  jour du numÃ©ro d'amendement si un nouveau est trouvÃ© dans le texte actuel
+            if "NÂ° I-" in current_text and (num_init is None or i != len(reader.pages) - 1):
+                new_num_init = extract_amendment_number(current_text)
+                if new_num_init and new_num_init != num_init:
+                    if num_init is not None:
+                        d[num_init] = text_accumulator
+                        text_accumulator = ""
+                    num_init = new_num_init
+            
+            text_accumulator += current_text
+
+            # Enregistrer le texte accumulÃ© si c'est la derniÃ¨re page
+            if i == len(reader.pages) - 1 and num_init is not None:
+                d[num_init] = text_accumulator
+    
+    return d
+
+def get_retires_and_inexistants(nattributed, moulinette2, d):
+    """
+    Identifie les amendements inexistants ou retirÃ©s avant publication ou dÃ©clarÃ©s irrecevables.
+
+    Args:
+        nattributed (DataFrame): DataFrame contenant les numÃ©ros d'amendements non attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame pour mettre Ã  jour le statut des amendements.
+        d (dict): Dictionnaire contenant le corps des amendements avec leur numÃ©ro comme clÃ©.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les statuts "inexistant" ou "RetirÃ©" pour les amendements concernÃ©s.
+    """
+    inexistant_atm = []  # Liste pour stocker les amendements inexistants
+    retire_av_pub = []  # Liste pour stocker les amendements retirÃ©s avant publication
+
+    # Parcourir la liste des numÃ©ros d'amendements non attribuÃ©s
+    for i in list(nattributed["N Â° amdt"]):
+        if i != 0:  # Ignorer l'amendement numÃ©ro 0 s'il est prÃ©sent
+            try:
+                # VÃ©rifier si l'amendement a Ã©tÃ© retirÃ© avant publication ou dÃ©clarÃ© irrecevable
+                if (fuzz.partial_ratio("RetirÃ© avant publication", d[i].replace("\n", "")) > 80 or
+                        fuzz.partial_ratio("Cet amendement a Ã©tÃ© retirÃ© avant sÃ©ance", d[i].replace("\n", "")) > 80 or
+                        fuzz.partial_ratio("Cet amendement a Ã©tÃ© dÃ©clarÃ© irrecevable aprÃ¨s diffusion en application de l'article 98 du rÃ¨glement de l'AssemblÃ©e nationale.", d[i].replace("\n", "")) > 80):
+                    retire_av_pub.append(i)
+                else:
+                    try:
+                        # Tentative d'extraction d'une section spÃ©cifique de l'amendement
+                        cartouche = d[i].replace("\n", " ").split("----")[0]
+                    except KeyError:
+                        # L'amendement est considÃ©rÃ© comme inexistant s'il n'est pas trouvÃ©
+                        print(f"Amendement {i} non trouvÃ©.")
+                        inexistant_atm.append(i)
+            except KeyError:
+                # L'amendement est marquÃ© inexistant s'il dÃ©clenche une KeyError lors de l'accÃ¨s
+                inexistant_atm.append(i)
+
+    # Mettre Ã  jour le DataFrame pour les amendements inexistants
+    for i in inexistant_atm:
+        moulinette2.loc[i-1, "Attribution finale"] = "inexistant"
+        print(f"amendement {i} est inexistant")
+
+    # Mettre Ã  jour le DataFrame pour les amendements retirÃ©s
+    for i in retire_av_pub:
+        moulinette2.loc[i-1, "Attribution finale"] = "RetirÃ©"
+        print(f"amendement {i} est RetirÃ©")
+
+    return moulinette2
+    
+    
+def get_retires_and_inexistants_senat(nattributed, moulinette2, d):
+    """
+    Identifie les amendements inexistants ou retirÃ©s avant publication au SÃ©nat.
+
+    Args:
+        nattributed (DataFrame): DataFrame contenant les numÃ©ros d'amendements non attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame oÃ¹ mettre Ã  jour le statut des amendements.
+        d (dict): Dictionnaire contenant le corps des amendements avec leurs numÃ©ros comme clÃ©s.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les statuts "inexistant" ou "RetirÃ©" pour les amendements concernÃ©s.
+    """
+    # Initialisation des listes pour stocker les amendements inexistants et retirÃ©s avant publication
+    inexistant_atm = []
+    retire_av_pub = []
+
+    # Parcours des numÃ©ros d'amendements non attribuÃ©s
+    for i in list(nattributed["N Â° amdt"]):
+        if i != 0:  # On ignore l'amendement numÃ©ro 0 s'il existe
+            if i not in list(d.keys()):
+                # Si le numÃ©ro d'amendement n'existe pas dans le dictionnaire, il est considÃ©rÃ© comme inexistant
+                inexistant_atm.append(i)
+            elif (fuzz.partial_ratio("RetirÃ© avant publication", d[i].replace("\n", "")) > 80 or 
+                  fuzz.partial_ratio("Cet amendement a Ã©tÃ© retirÃ© avant sÃ©ance", d[i].replace("\n", "")) > 80):
+                # Si le corps de l'amendement contient des mentions indiquant un retrait avant publication avec un certain seuil de similaritÃ©, il est considÃ©rÃ© comme retirÃ©
+                retire_av_pub.append(i)
+
+    # Mise Ã  jour du DataFrame moulinette2 pour marquer les amendements inexistants
+    for i in inexistant_atm:
+        moulinette2.loc[i-1, "Attribution finale"] = "inexistant"
+        print(f"amendement {i} est inexistant")
+
+    # Mise Ã  jour du DataFrame moulinette2 pour marquer les amendements retirÃ©s avant publication
+    for i in retire_av_pub:
+        moulinette2.loc[i-1, "Attribution finale"] = "RetirÃ©"
+        print(f"amendement {i} est RetirÃ©")
+
+    return moulinette2
+    
+def get_corps_amendements(amendments):
+    """
+    Extrait diffÃ©rentes parties du corps des amendements.
+
+    Args:
+        amendments (dict): Dictionnaire contenant les amendements, oÃ¹ chaque clÃ© est un identifiant unique.
+
+    Returns:
+        tuple: Trois dictionnaires contenant diffÃ©rentes extractions du corps des amendements.
+    """
+
+    # Initialisation des dictionnaires pour stocker les diffÃ©rentes extractions
+    short_body_extracts = dict()  # Extraits courts du corps
+    long_body_extracts = dict()  # Extraits longs du corps
+    full_bodies = dict()  # Corps complets des amendements
+
+    # ItÃ©ration sur chaque amendement en utilisant tqdm pour une barre de progression
+    for amendment_id in tqdm(list(amendments.keys())):
+        # On ignore l'identifiant 0 s'il est prÃ©sent
+        if amendment_id != 0:
+            try:
+                # Tentative d'extraction d'un extrait court du corps de l'amendement
+                split_point = amendments[amendment_id].split("------")[1].split("\n")[2]
+                short_extract = "".join(amendments[amendment_id].split(split_point)[1].split("\n")[1:3])
+            except:
+                # En cas d'Ã©chec, utiliser le corps complet comme extrait court
+                short_extract = amendments[amendment_id]
+
+            try:
+                # Tentative d'extraction d'un extrait long en cherchant "l'article suivant:"
+                long_extract = amendments[amendment_id].split("l'article suivant:")[1].split("perte de recettes")[0]
+            except:
+                try:
+                    # Si la premiÃ¨re tentative Ã©choue, essayer une extraction basÃ©e sur "------"
+                    long_extract = amendments[amendment_id].split("------")[1].split("perte de recettes")[0]
+                except:
+                    # En cas d'Ã©chec total, utiliser le corps complet
+                    long_extract = amendments[amendment_id]
+
+            # Assignation des extraits et du corps complet aux dictionnaires appropriÃ©s
+            short_body_extracts[amendment_id] = short_extract
+            long_body_extracts[amendment_id] = long_extract
+            full_bodies[amendment_id] = amendments[amendment_id]
+
+    # Retourner les trois dictionnaires contenant les extractions
+    return short_body_extracts, long_body_extracts, full_bodies
+
+ 
+def get_corps_amendements_senat(d):
+    """
+    Extrait des sections spÃ©cifiques du corps des amendements pour le SÃ©nat.
+
+    Args:
+        amendments (dict): Dictionnaire contenant les amendements, oÃ¹ chaque clÃ© est un identifiant unique d'amendement.
+
+    Returns:
+        tuple: Trois dictionnaires contenant respectivement des extraits courts, des extraits alternatifs courts,
+               et les corps complets de chaque amendement.
+    """
+    ###On rÃ©cupÃ¨re le corps des amendements
+    corps_dict = dict()
+    corps_dict2 = dict()
+    corps_dict3 = dict()
+    for i in tqdm(list(d.keys())):
+        if i != 0:
+                try:
+                    corps_small = d[i].split(d[i].split("AMENDEMENT")[1].split("\n")[3])[1].split("La perte de recettes")[0]
+                    if "Objet" in corps_small:
+                        corps_small = d[i].split(d[i].split("AMENDEMENT")[1].split("\n")[3])[1].split("Objet")[0]                        
+                except:
+                    try:
+                        corps_small = d[i].split(d[i].split("AMENDEMENT")[1].split("\n")[3])[1].split("Objet")[0]
+                    except:
+                        print(i)
+                if (corps_small == '\n'):
+                    corps_small = d[i].split("------")[1].split("La perte de recettes")[0].split("Objet")[0].replace("\n"," ")
+                corps_dict2[i] = corps_small
+                corps_dict[i] = corps_small
+                corps_dict3[i] = d[i]
+    return(corps_dict,corps_dict2,corps_dict3)
+
+
+def mapping_PLF_function(corps_dict2):
+    """
+    CrÃ©e un dictionnaire de mappage pour les clÃ©s d'un dictionnaire donnÃ©, en associant chaque clÃ© Ã  un indice numÃ©rique.
+
+    Exemple d'utilisation:
+        >>> corps_dict2 = {"Article 1": "Texte de l'article 1", "Article 2": "Texte de l'article 2"}
+        >>> mapping_PLF = mapping_PLF_function(corps_dict2)
+        >>> print(mapping_PLF)
+        {0: 'Article 1', 1: 'Article 2'}
+
+    Cette fonction est particuliÃ¨rement utile pour crÃ©er des indices numÃ©riques facilitant l'itÃ©ration, le rÃ©fÃ©rencement,
+    ou l'accÃ¨s direct aux Ã©lÃ©ments d'un dictionnaire basÃ© sur des identifiants textuels ou autres non numÃ©riques.
+    """
+    # Utilisation de la comprÃ©hension de dictionnaire pour crÃ©er mapping_PLF
+    mapping_PLF = {i: key for i, key in enumerate(corps_dict2.keys())}
+    return mapping_PLF
+
+
+
+def write_PLF(corps_dict2):
+    """
+    Ã‰crit le contenu d'un dictionnaire reprÃ©sentant les corps d'articles de PLF dans un fichier JSON.
+    
+    Args:
+        corps_dict2 (dict): Le dictionnaire contenant les corps d'articles de PLF Ã  Ã©crire dans un fichier JSON.
+                            Les clÃ©s du dictionnaire sont les numÃ©ros et les valeurs des chaÃ®nes de caractÃ¨res
+                            reprÃ©sentant le contenu textuel de chaque article.
+
+    Aucune valeur n'est retournÃ©e. La fonction crÃ©e ou Ã©crase le fichier "Corps_Articles_PLF.json" dans le rÃ©pertoire
+    """
+    # Utilisation du contexte with pour ouvrir le fichier
+    with open("../Corps_Articles_PLF.json", "w") as f:
+        # Ã‰criture directe du dictionnaire dans le fichier sous forme de JSON
+        json.dump(corps_dict2, f)
+ 
+def compare_same_PLF(corps_dict2,mapping_PLF,nattributed,attributed,moulinette2,ressemblance):
+    """
+    Compare les amendements d'un mÃªme PLF pour identifier et traiter les cas de similitudes basÃ©es sur un score de ressemblance.
+
+    Cette fonction examine les similitudes entre les textes des amendements et, en fonction de leur score de ressemblance,
+    effectue des mises Ã  jour d'attribution si nÃ©cessaire. Elle prend en compte uniquement les amendements non attribuÃ©s
+    et compare chaque amendement avec d'autres pour identifier les possibles doublons ou similitudes.
+
+    Args:
+        corps_dict2 (dict): Dictionnaire contenant le texte des amendements.
+        mapping_PLF (list): Liste des numÃ©ros d'amendements.
+        nattributed (DataFrame): DataFrame des amendements non attribuÃ©s.
+        attributed (DataFrame): DataFrame des amendements dÃ©jÃ  attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame global pour mise Ã  jour des attributions.
+        ressemblance (int): Seuil de score pour considÃ©rer deux amendements comme similaires.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les nouvelles attributions effectuÃ©es.
+    """
+    # Fonction interne pour vÃ©rifier et mettre Ã  jour l'attribution basÃ©e sur le score
+    def check_and_update_attribution(i, j, score):
+        # Condition pour vÃ©rifier si l'amendement actuel doit Ãªtre attribuÃ© ou signalÃ© comme trop court
+        if len(corps_dict2[mapping_PLF[i]].split("\n")) < 5 and score_list[i][j] < (ressemblance + 10 if ressemblance < 90 else 100):
+            print(f"ATTENTION PAS ATTRIBUE amendement numero {mapping_PLF[i]} est similaire Ã  {[mapping_PLF[duplicates_list[i][j]], score_list[i][j]]} mais trop court pour le score")
+        elif moulinette2.loc[mapping_PLF[duplicates_list[i][j]]-1, "Attribution finale"] not in ["NF", "RetirÃ©"]:
+            print(f"amendement numero {mapping_PLF[i]} est similaire Ã  {[mapping_PLF[duplicates_list[i][j]], score_list[i][j]]} on attribue Ã  {moulinette2.loc[mapping_PLF[duplicates_list[i][j]]-1,'Attribution finale']}")
+            moulinette2.loc[mapping_PLF[i]-1, "Attribution finale"] = moulinette2.loc[mapping_PLF[duplicates_list[i][j]]-1, "Attribution finale"]
+            return score_list[i][j]
+        return score
+                  
+    elements = [i.replace("\n","").replace("  "," ") for i in list(corps_dict2.values())]
+    sa = process.cdist(elements, elements, score_cutoff=ressemblance,workers=-1)
+
+    duplicates_list = []
+    score_list = []
+
+    for distances in sa:
+        # Get indices of duplicates
+        indices = np.argwhere(~np.isin(distances, [0, 0.0])).flatten()
+        duplicates_list.append(indices.tolist())
+        # Extraction des scores associÃ©s Ã  chaque duplicata identifiÃ©
+        scores = [distances[i] for i in indices]
+        score_list.append(scores)
+    for l in range(2):
+        print(f"{l+1}eme tour")
+        for i in range(len(score_list)):
+            if mapping_PLF[i] in nattributed["N Â° amdt"].tolist():
+                highest_score = 0
+                if len(duplicates_list[i]) > 1:
+                    for j in range(len(duplicates_list[i])):
+                        if mapping_PLF[duplicates_list[i][j]] != mapping_PLF[i] and mapping_PLF[duplicates_list[i][j]] in attributed["N Â° amdt"].tolist():
+                            try:
+                                if score_list[i][j] > highest_score:
+                                    highest_score = check_and_update_attribution(i, j, highest_score)
+                            except Exception as e:
+                                print(f"Error processing amendment {mapping_PLF[i]}: {e}")
+                                continue
+
+    return moulinette2
+ 
+def compare_same_PLF_senat(corps_dict2,mapping_PLF,nattributed,attributed,moulinette2,ressemblance):
+    """
+    Compare les amendements d'un mÃªme PLF du SÃ©nat pour identifier et traiter les cas de similitudes
+    basÃ©es sur un score de ressemblance. Met Ã  jour les attributions d'amendements en fonction des similitudes trouvÃ©es.
+
+    Args:
+        corps_dict2 (dict): Dictionnaire contenant le texte des amendements.
+        mapping_PLF (list): Liste des numÃ©ros d'amendements.
+        nattributed (DataFrame): DataFrame des amendements non attribuÃ©s.
+        attributed (DataFrame): DataFrame des amendements dÃ©jÃ  attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame global pour la mise Ã  jour des attributions.
+        ressemblance (int): Seuil de score pour considÃ©rer deux amendements comme similaires.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les nouvelles attributions rÃ©alisÃ©es.
+    """
+    elements = [i.replace("\n","").replace("  "," ") for i in list(corps_dict2.values())]
+    sa = process.cdist(elements, elements, score_cutoff=ressemblance,workers=-1)
+
+    duplicates_list = []
+    score_list = []
+
+    for distances in sa:
+        # Get indices of duplicates
+        indices = np.argwhere(~np.isin(distances, [0, 0.0])).flatten()
+        # Get names from indices
+        names = [x for x in indices]#indices#names = list(map(elements.__getitem__, indices))
+        duplicates_list.append(names)
+        
+        scores = [distances[x] for x in indices]
+        score_list.append(scores)
+    
+   # Boucle principale pour comparer et potentiellement mettre Ã  jour les attributions
+    for l in range(2):
+        print(f"{l+1}eme tour")
+        for i, scores in enumerate(score_list):
+            if mapping_PLF[i] in nattributed["N Â° amdt"].values:
+                highest_score = 0
+                for j, score in enumerate(scores):
+                    if mapping_PLF[duplicates_list[i][j]] != mapping_PLF[i] and mapping_PLF[duplicates_list[i][j]] in attributed["N Â° amdt"].values:
+                        condition = len(corps_dict2[mapping_PLF[i]].split("\n")) < 5 and score < (ressemblance + 10 if ressemblance < 90 else 100)
+                        # Logique spÃ©cifique pour les amendements similaires mais courts
+                        if condition:
+                            print(f"ATTENTION PAS ATTRIBUE amendement numero {mapping_PLF[i]} est similaire Ã  {mapping_PLF[duplicates_list[i][j]], score} mais trop court pour le score")
+                        elif "Supprimer cet article" not in corps_dict2[mapping_PLF[i]]:
+                            # Mise Ã  jour de l'attribution si les conditions sont remplies
+                            print(f"amendement numero {mapping_PLF[i]} est similaire Ã  {mapping_PLF[duplicates_list[i][j]], score} on attribue Ã  {moulinette2.loc[mapping_PLF[duplicates_list[i][j]]-1, 'Attribution finale']}")
+                            moulinette2.loc[mapping_PLF[i]-1, "Attribution finale"] = moulinette2.loc[mapping_PLF[duplicates_list[i][j]]-1, "Attribution finale"]
+                            highest_score = score
+    return moulinette2
+
+ 
+def which_PLF(n,d):
+    """
+    Identifie le PLF le plus proche et antÃ©rieur pour un numÃ©ro d'amendement donnÃ©.
+
+    Parcourt un dictionnaire reprÃ©sentant les PLFs avec leurs indices de dÃ©but correspondants et dÃ©termine
+    le PLF dont l'indice est le plus proche mais infÃ©rieur au numÃ©ro d'amendement spÃ©cifiÃ©. Cette fonction
+    est utile pour attribuer un amendement Ã  un PLF spÃ©cifique basÃ© sur son numÃ©ro d'ordre.
+
+    Args:
+        n (int): Le numÃ©ro d'amendement pour lequel trouver le PLF correspondant.
+        d (dict): Un dictionnaire oÃ¹ chaque clÃ© est le nom d'un PLF et chaque valeur est l'indice de dÃ©but
+                  de ce PLF dans une liste ou un DataFrame d'amendements.
+
+    Returns:
+        str: Le nom du PLF le plus proche et antÃ©rieur au numÃ©ro d'amendement donnÃ©. Si aucun PLF antÃ©rieur
+             n'est trouvÃ© (c'est-Ã -dire, tous les PLFs ont un indice de dÃ©but supÃ©rieur au numÃ©ro d'amendement),
+             la fonction retourne `None`.
+
+    Exemple:
+        >>> d = {"PLF 2018": 100, "PLF 2019": 200, "PLF 2020": 300}
+        >>> which_PLF(250, d)
+        'PLF 2019'
+        >>> which_PLF(99, d)
+        None
+    """
+    fdiff_min = float("inf")
+    cle_min = None
+    for cle,valeur in d.items():
+        diff = abs(valeur-n)
+        if valeur<n and diff < fdiff_min:
+            fdiff_min = diff
+            cle_min = cle
+    return(cle_min)
+
+def most_common(lst):
+    """
+    Trouve et retourne l'Ã©lÃ©ment le plus commun dans une liste.
+    """
+    return max(set(lst), key=lst.count)
+    
+    
+def get_old_PLFs(liste_doc):
+    """
+    Charge une sÃ©rie de fichiers Excel qui sont les extractions SIGNALE des projets de loi passÃ©s, et les concatÃ¨ne en un seul DataFrame. 
+    Construit Ã©galement un dictionnaire mappant le nom de chaque fichier PLF Ã  son indice de dÃ©but dans le DataFrame concatÃ©nÃ©, 
+    permettant de retracer l'historique de l'origine de chaque data point.
+
+    Args:
+        liste_doc (list): Liste des chemins de fichiers Excel Ã  charger. Le premier fichier dans la liste est considÃ©rÃ© comme le point de dÃ©part 
+                          de l'historique, avec les fichiers suivants ajoutÃ©s sÃ©quentiellement.
+
+    Returns:
+        tuple: Contient deux Ã©lÃ©ments:
+               - df_final (DataFrame): Un DataFrame pandas contenant toutes les donnÃ©es chargÃ©es Ã  partir des fichiers Excel listÃ©s, 
+                                        concatÃ©nÃ©es en une seule structure de donnÃ©es.
+               - mapping_historique (dict): Un dictionnaire oÃ¹ chaque clÃ© est le nom de base d'un fichier PLF (sans le chemin ni l'extension) 
+                                            et chaque valeur est l'indice de la premiÃ¨re ligne de ce fichier dans le DataFrame concatÃ©nÃ©, 
+                                            permettant d'identifier l'origine de chaque enregistrement.
+
+    Cette fonction est utile pour combiner des donnÃ©es de plusieurs pÃ©riodes ou versions de PLFs en une seule structure pour une analyse 
+    intÃ©grÃ©e ou pour maintenir un historique des changements sur le temps. Elle automatise le processus de chargement, de concatÃ©nation, 
+    et de mappage de l'origine des donnÃ©es pour faciliter le suivi et l'analyse.
+    """
+    # Charger le premier fichier Excel
+    dfs = [pd.read_excel(liste_doc[0])]
+    l_historique = [0]  # Initialiser l'historique avec 0 pour le premier fichier
+    
+    # Charger les fichiers restants et construire l'historique en une seule Ã©tape
+    for fichier in liste_doc[1:]:
+        nouveau_df = pd.read_excel(fichier)
+        l_historique.append(l_historique[-1] + dfs[-1].shape[0])
+        dfs.append(nouveau_df)
+        
+    # ConcatÃ©ner tous les DataFrames en une seule opÃ©ration
+    df_final = pd.concat(dfs, ignore_index=True)
+    
+    # Utiliser une comprÃ©hension de dictionnaire pour construire mapping_historique
+    mapping_historique = {fichier.split("\\")[-1].split("_Signale.xlsx")[0]: taille 
+                          for fichier, taille in zip(liste_doc, l_historique)}
+    
+    return df_final, mapping_historique
+
+
+    
+def compare_old_PLF(df,corps_dict2,mapping_PLF,nattributed,attributed,moulinette2,ressemblance,mapping_historique):
+    """
+    Compare les amendements d'anciens PLF avec des amendements actuels de l'AN pour identifier des similitudes basÃ©es sur un score de ressemblance.
+
+    Args:
+        df (DataFrame): DataFrame contenant les corps d'amendements actuels.
+        corps_dict2 (dict): Dictionnaire contenant les corps d'amendements d'anciens PLF.
+        mapping_PLF (list): Liste des identifiants d'amendements d'anciens PLF.
+        nattributed (DataFrame): DataFrame des amendements non attribuÃ©s.
+        attributed (DataFrame): DataFrame des amendements dÃ©jÃ  attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame pour la mise Ã  jour des attributions.
+        ressemblance (float): Seuil de ressemblance pour considÃ©rer deux amendements comme similaires.
+        mapping_historique (dict): Dictionnaire pour le mapping historique des amendements.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les attributions rÃ©alisÃ©es.
+    """
+
+    elements = [str(i).replace("\n","").replace("  "," ").split("pertederecette")[0].upper() for i in list(df["Corps amdt"])]
+    elements_PLF = [i.replace("\n","").replace("  "," ").upper() for i in list(corps_dict2.values())]
+    sa = process.cdist(elements_PLF, elements, score_cutoff=ressemblance,workers=-1)#,scorer = fuzz.token_sort_ratio)
+    
+    duplicates_list = []
+    score_list = []
+    
+    
+    for distances in sa:
+        # Get indices of duplicates
+        indices = np.argwhere(~np.isin(distances, [0, 0.0])).flatten()
+        # Get names from indices
+        names = [x for x in indices]#indices#names = list(map(elements.__getitem__, indices))
+        duplicates_list.append(names)
+        
+        scores = [distances[x] for x in indices]
+        score_list.append(scores)
+            
+    for i in range(len(score_list)):
+        if (mapping_PLF[i] in list(nattributed["N Â° amdt"])):
+            if (len(duplicates_list[i]) > 0):
+                l = []
+                if (len(corps_dict2[mapping_PLF[i]].split("\n")) < 5 and list(np.argsort(score_list[i])[:][::-1])[0] < (ressemblance*1.15 if ressemblance < 90 else 100)): 
+                     print(" ATTENTION PAS ATTRIBUE amendement numero "+str(mapping_PLF[i])+" est similaire Ã  "+str([[df["Num amdt"].iloc[duplicates_list[i][j]],which_PLF(duplicates_list[i][j],mapping_historique),score_list[i][j]]  for j in list(np.argsort(score_list[i])[:][::-1])]))
+                        
+                else:
+                    for j in list(np.argsort(score_list[i])[:][::-1]):
+                        try: 
+                            text = str(df["Objet amdt"].iloc[duplicates_list[i][j]])
+                            text = re.sub(r'MEFSIN-DLF-|MEFSIN/DLF-|MESFIN-DLF-|MESFIN--DLF-|MEFSIN--DLF-|Economie-|MESFIN-|MEFSIN-|DGFiP-|DGFIP-|DLF-', '', text)
+                            l.append(re.split(r'Intervenants : |[-â€“\\/]|\bIdentique\b', text)[1])
+                        except: 
+                            continue
+                    print("amendement numero "+str(mapping_PLF[i])+" est similaire Ã  "+str([[df["Num amdt"].iloc[duplicates_list[i][j]],which_PLF(duplicates_list[i][j],mapping_historique),score_list[i][j]]  for j in list(np.argsort(score_list[i])[:][::-1])]))
+                    print(l)
+                    try:
+                        if (most_common([i for i in l if i != ""]) != "RetirÃ©" and most_common([i for i in l if i != ""]) != "inexistant" and most_common([i for i in l if i != ""]) != "NF"):
+                            moulinette2.loc[mapping_PLF[i]-1,"Attribution finale"] = most_common([i for i in l if i != ""])
+                            print(most_common([i for i in l if i != ""]))
+                    except: 
+                        continue
+                print("#"*20)
+    return(moulinette2)
+
+def compare_old_PLF_senat(df,corps_dict2,mapping_PLF,nattributed,attributed,moulinette2,ressemblance,mapping_historique):
+    """
+    Compare les amendements d'anciens PLF avec des amendements actuels du SÃ©nat pour identifier des similitudes basÃ©es sur un score de ressemblance.
+
+    Args:
+        df (DataFrame): DataFrame contenant les corps d'amendements actuels.
+        corps_dict2 (dict): Dictionnaire contenant les corps d'amendements d'anciens PLF.
+        mapping_PLF (list): Liste des identifiants d'amendements d'anciens PLF.
+        nattributed (DataFrame): DataFrame des amendements non attribuÃ©s.
+        attributed (DataFrame): DataFrame des amendements dÃ©jÃ  attribuÃ©s.
+        moulinette2 (DataFrame): DataFrame pour la mise Ã  jour des attributions.
+        ressemblance (float): Seuil de ressemblance pour considÃ©rer deux amendements comme similaires.
+        mapping_historique (dict): Dictionnaire pour le mapping historique des amendements.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les attributions rÃ©alisÃ©es.
+    """
+    elements = [str(i).replace("\n","").replace("  "," ").split("pertederecette")[0].upper() for i in list(df["Corps amdt"])]
+    elements_PLF = [i.replace("\n","").replace("  "," ").upper() for i in list(corps_dict2.values())]
+    sa = process.cdist(elements_PLF, elements, score_cutoff=ressemblance,workers=-1)#,scorer = fuzz.token_sort_ratio)
+    
+    duplicates_list = []
+    score_list = []
+    
+    
+    for distances in sa:
+        # Get indices of duplicates
+        indices = np.argwhere(~np.isin(distances, [0, 0.0])).flatten()
+        # Get names from indices
+        names = [x for x in indices]#indices#names = list(map(elements.__getitem__, indices))
+        duplicates_list.append(names)
+        
+        scores = [distances[x] for x in indices]
+        score_list.append(scores)
+            
+    for i in range(len(score_list)):
+        if (mapping_PLF[i] in list(nattributed["N Â° amdt"])):
+            if (len(duplicates_list[i]) > 0):
+                l = []
+                if (len(corps_dict2[mapping_PLF[i]].split("\n")) <= 5 and list(np.argsort(score_list[i])[:][::-1])[0] < (ressemblance*1.15 if ressemblance <= 90 else 100)): 
+                     print(" ATTENTION PAS ATTRIBUE amendement numero "+str(mapping_PLF[i])+" est similaire Ã  "+str([[df["Num amdt"].iloc[duplicates_list[i][j]],which_PLF(duplicates_list[i][j],mapping_historique),score_list[i][j]]  for j in list(np.argsort(score_list[i])[:][::-1])]))
+                        
+                else:
+                    for j in list(np.argsort(score_list[i])[:][::-1]):
+                        try: 
+                            text = str(df["Objet amdt"].iloc[duplicates_list[i][j]])
+                            text = re.sub(r'MEFSIN-DLF-|MEFSIN/DLF-|MESFIN-DLF-|MESFIN--DLF-|MEFSIN--DLF-|Economie-|MESFIN-|MEFSIN-|DGFiP-|DGFIP-|DLF-', '', text)
+                            l.append(re.split(r'Intervenants : |[-â€“\\/]|\bIdentique\b', text)[1])
+                        except: 
+                            continue
+                    print("amendement numero "+str(mapping_PLF[i])+" est similaire Ã  "+str([[df["Num amdt"].iloc[duplicates_list[i][j]],which_PLF(duplicates_list[i][j],mapping_historique),score_list[i][j]]  for j in list(np.argsort(score_list[i])[:][::-1])]))
+                    print(l)
+                    try:
+                        if ((most_common([i for i in l if i != ""]) != "RetirÃ©" and most_common([i for i in l if i != ""]) != "inexistant") and most_common([i for i in l if i != ""]) != "inexistant"):
+                            moulinette2.loc[mapping_PLF[i]-1,"Attribution finale"] = most_common([i for i in l if i != ""])
+                            print(most_common([i for i in l if i != ""]))
+                    except: 
+                        continue
+                print("#"*20)
+    return(moulinette2)
+
+
+
+def get_dicts(moulinetteCGI, moulinettePLF, moulinetteCIBS, moulinetteCDD, moulinetteCodeExt, moulinetteCodeMots):
+    """
+    CrÃ©e et retourne des dictionnaires Ã  partir de DataFrames spÃ©cifiques, associant nomenclatures, articles, 
+    et bureaux Ã  leurs compÃ©tences respectives dans diffÃ©rents contextes (CGI, PLF, CIBS, CDD, codes externes).
+    Chaque dictionnaire renvoyÃ© associe des articles (comme la nomenclature ou les mots-clÃ©s) Ã  des valeurs 
+    reprÃ©sentant des compÃ©tences mÃ©tier par bureau.
+    Args:
+        moulinetteCGI (DataFrame): DataFrame contenant les colonnes "Nomenclature CGI" et "CompÃ©tence " pour le Code GÃ©nÃ©ral des ImpÃ´ts.
+        moulinettePLF (DataFrame): DataFrame contenant les colonnes "Article PLF" et "CompÃ©tence" pour le Projet de Loi de Finances.
+        moulinetteCIBS (DataFrame): DataFrame contenant les colonnes "Nomenclature CIBS" et "CompÃ©tence" pour les Biens et Serives.
+        moulinetteCDD (DataFrame): DataFrame contenant les colonnes "Nomenclature CDD" et "CompÃ©tence " pour le Code des Douanes.
+        moulinetteCodeExt (DataFrame): DataFrame contenant les colonnes "Nom du code", "Article", et "MinistÃ¨re/direction compÃ©tentes" pour les codes externes Ã  bercy.
+        moulinetteCodeMots (DataFrame): DataFrame contenant les colonnes "Mots-clÃ©s" et "MinistÃ¨re/direction compÃ©tents" pour une association basÃ©e sur des mots-clÃ©s de l'exposÃ© sommaire.
+    Returns:
+        tuple: Contient six dictionnaires (CGI, PLF, CIBS, CDD, CodeExt, Mots) oÃ¹ chaque dictionnaire associe des Ã©lÃ©ments clÃ©s Ã  des compÃ©tences bureau pour un type de code ou des mots clÃ©s.
+        """
+    CGI = {str(nomenclature): str(competence) for nomenclature, competence in zip(moulinetteCGI["Nomenclature CGI"], moulinetteCGI["CompÃ©tence "])}
+    PLF = {str(article): str(competence) for article, competence in zip(moulinettePLF["Article PLF"], moulinettePLF["CompÃ©tence"])}
+    CIBS = {str(nomenclature): str(competence) for nomenclature, competence in zip(moulinetteCIBS["Nomenclature CIBS"], moulinetteCIBS["CompÃ©tence"])}
+    CDD = {str(nomenclature): str(competence) for nomenclature, competence in zip(moulinetteCDD["Nomenclature CDD"], moulinetteCDD["CompÃ©tence "])}
+    CodeExt = {str(nom): (str(article) + " " + str(direction)).replace("nan ", "") for nom, article, direction in zip(moulinetteCodeExt["Nom du code"], moulinetteCodeExt["Article"], moulinetteCodeExt["MinistÃ¨re/direction compÃ©tentes"])}
+
+    Mots = {str(mot): str(direction) for mot, direction in zip(moulinetteCodeMots["Mots-clÃ©s"], moulinetteCodeMots["MinistÃ¨re/direction compÃ©tents"])}
+
+    return CGI, PLF, CIBS, CDD, CodeExt, Mots
+
+
+def find_longest_substring(string, dictionary):
+    """
+    Trouve la clÃ© la plus longue dans un dictionnaire qui est une sous-chaÃ®ne de la chaÃ®ne donnÃ©e.   
+    Args:
+        string (str): La chaÃ®ne de caractÃ¨res dans laquelle rechercher les sous-chaÃ®nes.
+        dictionary (dict): Un dictionnaire dont les clÃ©s seront recherchÃ©es comme sous-chaÃ®nes dans `string`.
+    Returns:
+        str: La clÃ© la plus longue du dictionnaire qui est une sous-chaÃ®ne de `string`. Si aucune clÃ© correspondante
+             n'est trouvÃ©e, retourne une chaÃ®ne vide.
+    """
+    normalized_string = string.replace(" ", "").upper()
+    
+    # Utilisez une comprÃ©hension de liste pour filtrer et trier les clÃ©s en une Ã©tape.
+    # Cela crÃ©e une liste de clÃ©s qui sont dans la chaÃ®ne, triÃ©es par longueur dÃ©croissante.
+    matching_keys = sorted(
+        (key for key in dictionary if key.replace(" ", "").upper() in normalized_string),
+        key=len,
+        reverse=True
+    )
+    
+    # Retournez la premiÃ¨re clÃ© (la plus longue) s'il y a des correspondances, sinon retournez une chaÃ®ne vide.
+    return matching_keys[0] if matching_keys else ""
+
+    
+def get_place(d, nattributed):
+    """
+    Extrait et associe l'information de position des amendements dans le texte Ã  leurs numÃ©ros correspondants dans un dictionnaire. 
+
+    Parcourt un DataFrame contenant des numÃ©ros d'amendements et extrait leur "place" spÃ©cifique Ã  partir d'un dictionnaire
+    donnÃ©. La "place" fait rÃ©fÃ©rence Ã  la position de l'amendement dans le texte, identifiant si l'amendement vise un article
+    existant ou introduit de nouvelles dispositions non couvertes par les articles existants.
+
+    Args:
+        d (dict): Dictionnaire avec les numÃ©ros d'amendements comme clÃ©s et le texte complet de l'amendement comme valeurs.
+        nattributed (DataFrame): DataFrame contenant au moins une colonne "N Â° amdt" avec les numÃ©ros d'amendements.
+
+    Returns:
+        dict: Un dictionnaire oÃ¹ chaque clÃ© est un numÃ©ro d'amendement et chaque valeur est la "place" de cet amendement,
+              nettoyÃ©e et prÃªte Ã  l'utilisation.
+    """
+    place_dict = {}
+    for i in tqdm(nattributed["N Â° amdt"]):
+        if i != 0:  # Assurez-vous que cette condition est nÃ©cessaire.
+            try:
+                place = d[i].split("------")[1].split("\n")[2].replace(":", "").replace("\n", "")
+                place_dict[i] = place.strip()  # .strip() pour enlever les espaces blancs avant et aprÃ¨s
+            except IndexError as e:  
+                print(e)
+                pass
+    return place_dict
+
+def get_place_senat(d,nattributed):
+    """
+    Extrait et associe l'information de position des amendements dans le texte Ã  leurs numÃ©ros correspondants dans un dictionnaire. 
+
+    Parcourt un DataFrame contenant des numÃ©ros d'amendements et extrait leur "place" spÃ©cifique Ã  partir d'un dictionnaire
+    donnÃ©. La "place" fait rÃ©fÃ©rence Ã  la position de l'amendement dans le texte, identifiant si l'amendement vise un article
+    existant ou introduit de nouvelles dispositions non couvertes par les articles existants.
+
+    Args:
+        d (dict): Dictionnaire avec les numÃ©ros d'amendements comme clÃ©s et le texte complet de l'amendement comme valeurs.
+        nattributed (DataFrame): DataFrame contenant au moins une colonne "N Â° amdt" avec les numÃ©ros d'amendements.
+
+    Returns:
+        dict: Un dictionnaire oÃ¹ chaque clÃ© est un numÃ©ro d'amendement et chaque valeur est la "place" de cet amendement,
+              nettoyÃ©e et prÃªte Ã  l'utilisation.
+    """
+    place_dict = dict()
+    for i in tqdm(list(nattributed["N Â° amdt"])):
+        if i != 0:
+                try:
+                    place = "ARTICLE"+d[i].split("\nARTICLE")[1].split("\n")[0]
+                    place_dict[i] = place
+                except:
+                    continue
+    return(place_dict)
+
+def attribution_via_texte(moulinette2,attributed,nattributed,corps_dict,corps_dict2,ressemblance,CGI,CDD,CIBS,PLF,CodeExt,Mots,place_dict):
+    """
+    Attribue des amendements Ã  des catÃ©gories spÃ©cifiques basÃ©es sur leur contenu texte.
+
+    Cette fonction examine le contenu texte de chaque amendement pour dÃ©terminer Ã  quelle catÃ©gorie
+    il appartient (par exemple, CGI, CDD, CIBS, PLF, etc.) en utilisant des rÃ¨gles mÃ©tiers de recherche
+    et de correspondance de texte. Les amendements sont ensuite mis Ã  jour dans le DataFrame `moulinette2`
+    avec l'attribution finale basÃ©e sur ces critÃ¨res.
+
+    Args:
+        moulinette2 (DataFrame): DataFrame contenant les amendements Ã  attribuer.
+        attributed (DataFrame): DataFrame contenant les amendements dÃ©jÃ  attribuÃ©s (non utilisÃ© dans cette fonction).
+        nattributed (DataFrame): DataFrame contenant les amendements non attribuÃ©s.
+        corps_dict (dict): Dictionnaire avec le corps des amendements non attribuÃ©s.
+        corps_dict2 (dict): Dictionnaire alternatif avec le corps des amendements non attribuÃ©s.
+        ressemblance (int): Seuil de similaritÃ© pour la correspondance de texte.
+        CGI (dict): Dictionnaire des articles du Code GÃ©nÃ©ral des ImpÃ´ts pour l'attribution.
+        CDD (dict): Dictionnaire des articles des Douanes pour l'attribution.
+        CIBS (dict): Dictionnaire des articles CIBS pour l'attribution.
+        PLF (dict): Dictionnaire des articles du Projet de Loi de Finances pour l'attribution.
+        CodeExt (dict): Dictionnaire des codes externes pour l'attribution aux externes bercy (code du cinÃ©ma par ex).
+        Mots (dict): Dictionnaire des mots-clÃ©s pour l'attribution.
+        place_dict (dict): Dictionnaire de la position des amendements (non utilisÃ© dans cette fonction).
+
+    Returns:
+        DataFrame: Le DataFrame `moulinette2` mis Ã  jour avec les attributions finales pour chaque amendement.
+    """
+    # Initialisation des dictionnaires pour l'attribution
+    attrib_CGI = {}
+    attrib_CDD = {}
+    attrib_CIBS = {}
+    attrib_PLF = {}
+    attrib_CodeExt = {}
+    attrib_Mots = {}
+    pattern_digits = re.compile('\d+')
+    
+    def find_article_and_assign(amdt_id, corps, dictionnaire, attrib_dict, default_value=None):
+        try:
+            article = find_longest_substring(corps, dictionnaire)
+            attrib_dict[amdt_id] = dictionnaire.get(article, default_value)
+            moulinette2.loc[amdt_id-1, "Attribution finale"] = attrib_dict[amdt_id]
+            print(f"amendement {amdt_id} a Ã©tÃ© identifiÃ© traitant de l'article {article} il a donc Ã©tÃ© attribuÃ© Ã  {attrib_dict[amdt_id]}")
+        except IndexError:
+            pass
+
+    for i in tqdm(nattributed["N Â° amdt"]):
+        corps = corps_dict[i].replace("\n", "")
+        if any(fuzz.partial_ratio(keyword, corps, processor=rapidfuzz.utils.default_process) > ressemblance for keyword in ["code gÃ©nÃ©ral des impÃ´ts", "CGI"]):
+            find_article_and_assign(i, corps, CGI, attrib_CGI)
+        elif fuzz.partial_ratio("biens et services", corps) > ressemblance:
+            find_article_and_assign(i, corps, CIBS, attrib_CIBS)
+        elif fuzz.partial_ratio("douanes", corps) > ressemblance:
+            find_article_and_assign(i, corps, CDD, attrib_CDD, "DGDDI")
+        else:
+            try:
+                text = corps_dict2.get(i, "")
+                premier_digit = pattern_digits.findall(text.split("ARTICLE")[1])[0] if "ARTICLE" in text else None
+                if premier_digit:
+                    key = premier_digit
+                    if "alinÃ©a" in text.lower():
+                        second_digit = pattern_digits.findall(text.split("alinÃ©a", 1)[1])[0] if "alinÃ©a" in text else None
+                        key = f"{premier_digit} {second_digit}" if second_digit else premier_digit
+                    attrib_PLF[i] = PLF.get(key, "")
+                    moulinette2.loc[i - 1, "Attribution finale"] = attrib_PLF[i]
+                    print(f"amendement {i} a Ã©tÃ© identifiÃ© comme PLF traitant de l'article {key} il a donc Ã©tÃ© attribuÃ© Ã  {attrib_PLF[i]}")
+            except:
+                continue
+                
+    return(moulinette2)
+    
+def get_dicts_expo_sommaire(moulinetteMots_expo):
+    """
+    Construit un dictionnaire Ã  partir d'un DataFrame en associant des mots-clÃ©s Ã  des ministÃ¨res ou bureaux compÃ©tents.
+
+    Cette fonction parcourt chaque ligne du DataFrame fourni et construit un dictionnaire oÃ¹ chaque clÃ© est un
+    mot-clÃ© unique et chaque valeur est le ministÃ¨re ou la direction compÃ©tente associÃ©e Ã  ce mot-clÃ©.
+
+    Args:
+        moulinetteMots_expo (DataFrame): DataFrame contenant au moins deux colonnes: "Mots-clÃ©s" et
+                                         "MinistÃ¨re/direction compÃ©tents". Chaque ligne reprÃ©sente une association
+                                         unique entre un mot-clÃ© et un ministÃ¨re/direction compÃ©tent.
+    Returns:
+        dict: Dictionnaire oÃ¹ les clÃ©s sont des mots-clÃ©s et les valeurs sont les ministÃ¨res ou directions
+              compÃ©tents associÃ©s Ã  ces mots-clÃ©s.
+
+    Exemple d'utilisation:
+        >>> moulinetteMots_expo = pd.DataFrame({
+        ...     "Mots-clÃ©s": ["budget", "fiscalitÃ©"],
+        ...     "MinistÃ¨re/direction compÃ©tents": ["MinistÃ¨re des Finances", "Direction GÃ©nÃ©rale des Finances"]
+        ... })
+        >>> get_dicts_expo_sommaire(moulinetteMots_expo)
+        {'budget': 'MinistÃ¨re des Finances', 'fiscalitÃ©': 'Direction GÃ©nÃ©rale des Finances'}
+    """
+    # Utilisation de la comprÃ©hension de dictionnaire pour une construction directe
+    Mots_expo = {row["Mots-clÃ©s"]: row["MinistÃ¨re/direction compÃ©tents"] for _, row in moulinetteMots_expo.iterrows()}
+    return Mots_expo
+
+    
+def attribution_via_mots_cles_expo_sommaire(moulinette2, attributed, nattributed, corps_dict, corps_dict2, score_ressemblance, Mots, place_dict, Mots_expo, CodeExt):
+    """
+    Attribue des amendements Ã  des bureaux spÃ©cifiques basÃ©es sur la correspondance de mots-clÃ©s
+    dans leur texte de l'exposÃ© sommaire, en utilisant diffÃ©rents dictionnaires de mots-clÃ©s.
+
+    Cette fonction examine le texte de chaque amendement pour identifier des correspondances avec des mots-clÃ©s
+    dÃ©finis dans plusieurs dictionnaires (Codes Exterieurs Ã  Bercy, Mots, Mots_expo). Si un mot-clÃ© correspondant est trouvÃ©
+    avec une similaritÃ© supÃ©rieure ou Ã©gale Ã  un seuil de score de ressemblance, l'amendement est attribuÃ©
+    Ã  la catÃ©gorie associÃ©e Ã  ce mot-clÃ©.
+
+    Args:
+        moulinette2 (DataFrame): DataFrame contenant les amendements Ã  attribuer.
+        attributed (DataFrame): DataFrame des amendements dÃ©jÃ  attribuÃ©s (non utilisÃ© dans cette fonction).
+        nattributed (DataFrame): DataFrame des amendements non attribuÃ©s.
+        corps_dict (dict): Dictionnaire contenant le dÃ©but des amendements non attribuÃ©s.
+        corps_dict2 (dict): Dictionnaire alternatif sensiblement plus long contenant le texte des amendements (non utilisÃ© dans cette fonction).
+        score_ressemblance (int): Seuil de score de similaritÃ© pour la correspondance des mots-clÃ©s.
+        Mots (dict): Dictionnaire des mots-clÃ©s gÃ©nÃ©raux et leurs attributions correspondantes.
+        place_dict (dict): Dictionnaire de la position des amendements (non utilisÃ© dans cette fonction).
+        Mots_expo (dict): Dictionnaire des mots-clÃ©s spÃ©cifiques Ã  l'exposÃ© sommaire et leurs attributions.
+        CodeExt (dict): Dictionnaire des codes externes et leurs attributions.
+
+    Returns:
+        DataFrame: Le DataFrame moulinette2 mis Ã  jour avec les attributions finales pour chaque amendement
+                   basÃ© sur les mots-clÃ©s correspondants.
+
+    La fonction dÃ©lÃ©guÃ©e `attribuer_code` est utilisÃ©e pour rechercher des correspondances de mots-clÃ©s dans le
+    texte de chaque amendement et attribuer l'amendement Ã  la catÃ©gorie appropriÃ©e si une correspondance est trouvÃ©e.
+    L'attribution est effectuÃ©e sÃ©quentiellement pour chaque dictionnaire de mots-clÃ©s fourni.
+    """
+    def attribuer_code(i, dictionnaire, attrib_dict):
+        cleaned_text = corps_dict[i].replace("\n", "")
+        for key, value in dictionnaire.items():
+            if fuzz.partial_ratio(key, cleaned_text, processor=rapidfuzz.utils.default_process) >= score_ressemblance:
+                attrib_dict[i] = value
+                print(f"amendement {i} contient {key} il a donc Ã©tÃ© attribuÃ© Ã  {value}")
+                moulinette2.loc[i-1, "Attribution finale"] = value
+                break  # Sortie immÃ©diate aprÃ¨s la premiÃ¨re correspondance
+
+    attrib_CodeExt = {}
+    attrib_Mots = {}
+    attrib_Mots_expo = {}
+
+    for i in tqdm(nattributed["N Â° amdt"].tolist()):
+        attribuer_code(i, CodeExt, attrib_CodeExt)
+        attribuer_code(i, Mots, attrib_Mots)
+        attribuer_code(i, Mots_expo, attrib_Mots_expo)
+
+    return moulinette2
+        
+def missing_code(moulinette2):
+    """
+    Identifie et affiche les articles les plus communs non attribuÃ©s pour des codes de loi spÃ©cifiques.
+
+    Cette fonction parcourt une liste prÃ©dÃ©finie de codes de loi (par exemple, "c douanes", "CGI") et
+    recherche dans un DataFrame donnÃ© les cas oÃ¹ l'attribution Ã  l'article des codes pour ces lois est manquante.
+    Elle affiche ensuite les articles non attribuÃ©s les plus communs pour chaque code de loi.
+
+    Args:
+        moulinette2 (DataFrame): DataFrame contenant des donnÃ©es d'amendements, incluant les colonnes
+                                 "Attribution Ã  l'article des codes" et "Code & loi" pour identifier les
+                                 attributions manquantes, ainsi que "Article du CGI ou LPF retraitÃ©" pour
+                                 dÃ©terminer les articles les plus communs non attribuÃ©s.
+
+    Aucune valeur n'est retournÃ©e. La fonction se contente d'afficher les rÃ©sultats.
+
+    Exemple d'utilisation:
+        Supposons que `moulinette2` soit un DataFrame contenant des informations sur des amendements,
+        y compris leur code de loi et l'attribution Ã  l'article des codes. Cette fonction peut Ãªtre utilisÃ©e
+        pour identifier quels articles liÃ©s au Code GÃ©nÃ©ral des ImpÃ´ts (CGI) ou au code des douanes n'ont pas
+        encore Ã©tÃ© attribuÃ©s, en affichant les plus communs parmi eux afin de modifier les rÃ¨gles mÃ©tier intelligement.
+    """
+    codes_loi = ["c douanes", "CGI"]  # Liste des "Code & loi" Ã  vÃ©rifier
+    
+    for code in codes_loi:
+        print(f"codes qui manquent pour le {code}")
+        
+        # Filtrage direct des donnÃ©es non attribuÃ©es pour le "Code & loi" actuel
+        nattributed = moulinette2[~moulinette2["Attribution Ã  l'article des codes"].notnull() & 
+                                  (moulinette2["Code & loi"] == code)]
+                                  
+        # Affichage des articles les plus communs non attribuÃ©s
+        common_articles = Counter(nattributed["Article du CGI ou LPF retraitÃ©"].astype(str)).most_common()
+        print(common_articles)
+    
+    
+def ecrire_resultat(moulinette_location):
+    file_path = '..\\logs.txt'
+
+    with open(file_path,encoding="utf-8") as file:
+        text = file.read()
+        
+    #### PremiÃ¨re partie 
+    d = {}
+    for i in text.split("identifier les numÃ©ros dâ€™amendements identiques au sein dâ€™une mÃªme lecture")[1].split("tour")[1].split("Identification des identiques dans les PLF prÃ©cÃ©dents")[0].split("\n"):
+        if "amendement" in i:
+            try:
+                n_amdt = i.split("amendement numero ")[1].split(" ")[0]
+                corr = i.split("[")[1].split("]")[0].replace(",","")
+                corr = corr.replace(" "," (")+")"
+                d[n_amdt] = d.get(n_amdt,'')+str(corr)+"/ "
+            except:
+                continue
+    # j'ai un dictionnaire avec des clÃ©s en entier de 1 Ã  n (non continu)
+    # une liste de taille n qui va stocker mes rÃ©sultats
+    try:
+        taille = max([int(i) for i in list(d.keys())])
+    except:
+        taille = 0
+    liste_sim = []
+    for i in range(1,taille):
+        if str(i) in list(d.keys()):
+            liste_sim.append(d[str(i)])
+        else:
+            liste_sim.append("")
+            
+    #### Seconde partie 
+    d = {}
+    for i in text.split("Identification des identiques dans les PLF prÃ©cÃ©dents")[1].split("attribution supplÃ©mentaire mots clÃ©s")[0].split("\n"):
+        if "amendement numero" in i:
+            n_amdt = i.split("amendement numero ")[1].split(" ")[0]
+            corr = i.split("similaire Ã  ")[1]
+            #corr = corr.replace("[","(").replace("]",")")
+            d[n_amdt] = d.get(n_amdt,'')+str(corr)+" "
+    # j'ai un dictionnaire avec des clÃ©s en entier de 1 Ã  n (non continu)
+    # une liste de taille n qui va stocker mes rÃ©sultats
+    try:
+        taille = max([int(i) for i in list(d.keys())])
+    except:
+        taille = 0
+    liste_prec = []
+    for i in range(1,taille):
+        if str(i) in list(d.keys()):
+            liste_prec.append(d[str(i)])
+        else:
+            liste_prec.append("")
+    ### TroisiÃ¨me partie
+    d = {}
+    for i in text.split("Attribution de lâ€™amendement par lâ€™IA")[1].split("Codes qu'il manque au niveau de la moulinette")[0].split("\n"):
+        if ("amendement" in i and "dÃ©jÃ " not in i):
+            try:
+                n_amdt = i.split("amendement ")[1].split(" ")[0]
+                corr = i.split("comme ")[1].split(" ")[0]+" "+i.split("article ")[1].split("il")[0]+" "+i.split("attribuÃ© Ã  ")[1]
+                d[n_amdt] = corr
+            except:
+                try:
+                    n_amdt = i.split("amendement ")[1].split("contient")[0]
+                    corr = i.split("contient")[1].split(" il a donc Ã©tÃ©")[0]
+                    d[n_amdt] = corr
+                except:
+                    try:
+                        n_amdt = i.split("amendement ")[1].split(" ")[0]
+                        corr = i.split("traitant de l'article ")[1].split(" il a donc Ã©tÃ©")[0]
+                        d[n_amdt] = corr
+                    except:
+                        continue
+    print(d)
+    try:
+        taille = max([int(i) for i in list(d.keys())])
+    except:
+        taille = 0
+    liste_txt = []
+    for i in range(1,taille):
+        if str(i) in list(d.keys()):
+            liste_txt.append(d[str(i)])
+        else:
+            liste_txt.append("")
+    print(liste_txt)
+            
+    
+    moulinette2 = pd.read_excel(moulinette_location,sheet_name=1)
+    moulinette2 = moulinette2[moulinette2["N Â° amdt"] != 0]
+    
+    for i in [liste_sim,liste_prec,liste_txt]:
+        while(len(i) != len(moulinette2)):
+            i.append("")
+            
+    moulinette2["Similaires"] = liste_sim
+    moulinette2["Similaires_prec"] = liste_prec
+    moulinette2["attributions IA"] = liste_txt
+    
+    moulinette2 = moulinette2[['N Â° amdt', "Sort de l'amdt", 'Ã‰tat', 'Article PLF + alinÃ©a',
+       'Article du CGI ou LPF', 'Article du CGI ou LPF retraitÃ©', 'Code & loi',
+       "Attribution Ã  l'article des codes (non retraitÃ©e)",
+       "Attribution Ã  l'article des codes", "Attribution Ã  l'article du PLF",'Similaires', 'Similaires_prec', 'attributions IA','Attribution finale']]
+    
+    GT = pd.read_csv("..\\attribution_finale.csv")
+    moulinette2["Attribution finale avec DTNUM"] = GT["Attribution finale"]
+    moulinette2 = moulinette2.rename(columns={'Attribution finale': 'Attribution Moulinette'})
+    
+    moulinette2.to_csv("..\\attribution_finale.csv",sep=";",encoding="utf-16")
+    moulinette2.to_excel("..\\attribution_finale.xlsx")
+    return(0)
diff --git a/Fuzzy_attrib/tkinter_interface.py b/Fuzzy_attrib/tkinter_interface.py
new file mode 100644
index 0000000000000000000000000000000000000000..8449107068e7c44cabd1782dd1d3dffea1aff781
--- /dev/null
+++ b/Fuzzy_attrib/tkinter_interface.py
@@ -0,0 +1,239 @@
+import tkinter as tk
+from tkinter import filedialog
+from tkinter import messagebox
+from functions import *
+import sys
+
+doc = f"""Bienvenue sur le Trieur d'amendements DLF!
+
+Pour utiliser cet outil, veuillez suivre les Ã©tapes suivantes:
+
+1. Indiquez l'emplacement de la moulinette, du PLF Ã  trier et de l'historique des PLFs en cliquant sur les boutons 'Parcourir...'.
+
+2. DÃ©finissez le score de ressemblance souhaitÃ© entre les amendements du PLF Ã  trier et ceux de l'historique des PLFs en dÃ©plaÃ§ant le curseur.
+
+3. Cliquez sur le bouton 'Trier les amendements' pour lancer le tri.
+
+4. Le rÃ©sultat sera affichÃ© dans une boÃ®te de dialogue.
+
+Si vous avez besoin d'aide, n'hÃ©sitez pas Ã  cliquer sur le bouton '?' pour afficher cette documentation.
+
+Inputs:
+- Moulinette location: emplacement de la moulinette dÃ©jÃ  lancÃ©e manuellement
+- PLF Ã  trier location: emplacement des liasses du PLF Ã  trier
+- Historique des PLFs location: emplacement de l'historique des PLFs prÃ©cÃ©dents au format xlsx
+- Score de ressemblance: score de ressemblance souhaitÃ© entre les amendements
+
+Bonne utilisation!
+"""
+
+class AideWindow:
+    def __init__(self, master):
+        self.master = master
+        master.title("Aide")
+        self.label = tk.Label(master, text=doc)
+        self.label.pack()
+
+class TrieurAmendementsDLF:
+    def __init__(self, master):
+        self.master = master
+        master.title("Trieur d'amendements DLF")
+
+        # Input pour la moulinette
+        self.label_moulinette = tk.Label(master, text="Moulinette dÃ©jÃ  lancÃ©e:")
+        self.label_moulinette.grid(row=0, column=0)
+        self.entry_moulinette = tk.Entry(master)
+        self.entry_moulinette.grid(row=0, column=1)
+        self.button_moulinette = tk.Button(master, text="Parcourir...", command=self.get_moulinette_location)
+        self.button_moulinette.grid(row=0, column=2)
+
+        # Input pour le PLF Ã  trier
+        self.label_plf_a_trier = tk.Label(master, text="Liasses PLF Ã  trier:")
+        self.label_plf_a_trier.grid(row=1, column=0)
+        self.entry_plf_a_trier = tk.Entry(master)
+        self.entry_plf_a_trier.grid(row=1, column=1)
+        self.button_plf_a_trier = tk.Button(master, text="Parcourir...", command=self.get_plf_a_trier_location)
+        self.button_plf_a_trier.grid(row=1, column=2)
+
+        # Input pour l'historique des PLFs
+        self.label_historique_plfs = tk.Label(master, text="Historique des PLFs:")
+        self.label_historique_plfs.grid(row=2, column=0)
+        self.entry_historique_plfs = tk.Entry(master)
+        self.entry_historique_plfs.grid(row=2, column=1)
+        self.button_historique_plfs = tk.Button(master, text="Parcourir...", command=self.get_historique_plfs_location)
+        self.button_historique_plfs.grid(row=2, column=2)
+
+        # Curseur pour le score de ressemblance
+        self.score_ressemblance = tk.IntVar(value=80)
+        self.label_score_ressemblance = tk.Label(master, text="Score de ressemblance PLF actuel:")
+        self.label_score_ressemblance.grid(row=3, column=0)
+        self.scale_score_ressemblance = tk.Scale(master, from_=1, to=100, orient=tk.HORIZONTAL,length=200,variable=self.score_ressemblance)
+        self.scale_score_ressemblance.grid(row=3, column=1)
+        
+         # Curseur pour le score de ressemblance
+        self.score_ressemblance2 = tk.IntVar(value=70)
+        self.label_score_ressemblance2 = tk.Label(master, text="Score de ressemblance PLF passÃ©s:")
+        self.label_score_ressemblance2.grid(row=4, column=0)
+        self.scale_score_ressemblance2 = tk.Scale(master, from_=1, to=100, orient=tk.HORIZONTAL,length=200,variable=self.score_ressemblance2)
+        self.scale_score_ressemblance2.grid(row=4, column=1)
+
+        # Bouton pour trier les amendements
+        self.button_trier = tk.Button(master, text="Trier les amendements", command=self.trier_amendements)
+        self.button_trier.grid(row=5, column=1)
+
+        # Case besoin d'aide
+        self.label_aide = tk.Label(master, text="Besoin d'aide?")
+        self.label_aide.grid(row=6, column=0)
+        self.button_aide = tk.Button(master, text="?", command=self.afficher_aide)
+        self.button_aide.grid(row=6, column=1)
+
+    def get_moulinette_location(self):
+        location = filedialog.askopenfilename()
+        self.entry_moulinette.insert(0, location)
+
+    def get_plf_a_trier_location(self):
+        location = filedialog.askdirectory()
+        self.entry_plf_a_trier.insert(0, location)
+
+    def get_historique_plfs_location(self):
+        location = filedialog.askdirectory()
+        self.entry_historique_plfs.insert(0, location)
+
+    def trier_amendements(self):
+        #sys.stdout = open('./logs.txt', 'w')
+        
+        try:
+            os.remove("../logs.txt")
+        except OSError:
+            pass
+
+    
+        moulinette_location = self.entry_moulinette.get()
+        plf_a_trier_location = self.entry_plf_a_trier.get()
+        historique_plfs_location = self.entry_historique_plfs.get()
+        score_ressemblance = self.scale_score_ressemblance.get()
+        score_ressemblance2 = self.scale_score_ressemblance2.get()
+        
+        functions_mapping = {
+            "AN": {
+                "update_function": get_retires_and_inexistants,
+                "extraction_function": get_corps_amendements,
+                "extraction_place_function": get_place,
+                "comparison_function": compare_same_PLF,
+                "comparison_function_old": compare_old_PLF
+            },
+            "SENAT": {
+                "update_function": get_retires_and_inexistants_senat,
+                "extraction_function": get_corps_amendements_senat,
+                "extraction_place_function": get_place_senat,
+                "comparison_function": compare_same_PLF_senat,
+                "comparison_function_old": compare_old_PLF_senat
+            }
+        }
+        
+        
+        print("###############\n"*5)
+        print("on charge les amendements")
+        print("###############\n"*5)
+        d,doc_type = identifier_document_type(plf_a_trier_location)
+        doc_functions = functions_mapping.get(doc_type, None)
+        if doc_functions:
+            update_function = doc_functions.get("update_function")
+            extraction_function = doc_functions.get("extraction_function")
+            extraction_place_function = doc_functions.get("extraction_place_function")
+            comparison_function = doc_functions.get("comparison_function")
+            comparison_function_old = doc_functions.get("comparison_function_old")
+        
+        moulinette2 = pd.read_excel(moulinette_location,sheet_name=1)
+        moulinette2[moulinette2.columns[0]] = pd.to_numeric(moulinette2[moulinette2.columns[0]].replace('[a-zA-Z]', '', regex=True))
+        moulinette2 = moulinette2[moulinette2["N Â° amdt"] != 0]
+        nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+        attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+        get_attrib_score(attributed,nattributed)
+        
+        print("###############\n"*5)
+        print("on enlÃ¨ve les amendements qui ont Ã©tÃ© retirÃ©s avant publication et ceux qui sont inexistants")
+        print("###############\n"*5)
+        
+        # Application de la fonction choisie pour mettre Ã  jour 'moulinette2', si un type de document valide est fourni
+        if update_function:
+            moulinette2 = update_function(nattributed, moulinette2, d)
+        nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+        attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+        get_attrib_score(attributed,nattributed)
+        
+        print("###############\n"*5)
+        print("on rÃ©cupÃ¨re le corps des amendements")
+        print("###############\n"*5)
+        # Extraction des corps des amendements en utilisant la fonction appropriÃ©e
+        if extraction_function:
+            corps_dict, corps_dict2, corps_dict3 = extraction_function(d)
+        mapping_PLF = mapping_PLF_function(corps_dict2)
+        write_PLF(corps_dict3)
+          
+        print("###############\n"*5)
+        print("Attribution de lâ€™amendement par lâ€™IA (en fonction des mots clÃ©s relevÃ©s dans le corps")
+        print("###############\n"*5)
+        moulinettePLF, moulinetteCGI, moulinetteCIBS, moulinetteCDD, moulinetteCodeExt, moulinetteMots = (pd.read_excel(moulinette_location, sheet_name=sheet_num) for sheet_num in [2, 3, 4, 5, 6, 7])
+        CGI,PLF,CIBS,CDD,CodeExt,Mots = get_dicts(moulinetteCGI,moulinettePLF,moulinetteCIBS,moulinetteCDD,moulinetteCodeExt,moulinetteMots)
+
+        # Extraction des places en utilisant la fonction appropriÃ©e
+        if extraction_place_function:
+            place_dict = extraction_place_function(d, nattributed)
+
+        moulinette2 = attribution_via_texte(moulinette2,attributed,nattributed,corps_dict,corps_dict2,score_ressemblance,CGI,CDD,CIBS,PLF,CodeExt,Mots,place_dict)
+        nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+        attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+        get_attrib_score(attributed,nattributed)
+        
+        print("###############\n"*5)
+        print("identifier les numÃ©ros dâ€™amendements identiques au sein dâ€™une mÃªme lecture")
+        print("###############\n"*5)
+        if comparison_function:
+            moulinette2 = comparison_function(corps_dict2, mapping_PLF, nattributed, attributed, moulinette2, score_ressemblance)
+
+        nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+        attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+        get_attrib_score(attributed,nattributed)
+        
+        print("###############\n"*5)
+        print("Identification des identiques dans les PLF prÃ©cÃ©dents")
+        print("###############\n"*5) 
+        liste_doc = glob.glob(historique_plfs_location+"\\*.xlsx")
+        df,mapping_historique = get_old_PLFs(liste_doc)
+        
+        if comparison_function:
+            moulinette2 = comparison_function_old(df, corps_dict2, mapping_PLF, nattributed, attributed, moulinette2, score_ressemblance2, mapping_historique)
+       
+        nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+        attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+        get_attrib_score(attributed,nattributed)
+        
+        print("attribution supplÃ©mentaire mots clÃ©s")
+        try:
+            moulinetteMots_expo = pd.read_excel(moulinette_location,sheet_name=8)
+            Mots_expo = get_dicts_expo_sommaire(moulinetteMots_expo)
+            moulinette2 = attribution_via_mots_cles_expo_sommaire(moulinette2,attributed,nattributed,corps_dict2,corps_dict3,score_ressemblance,Mots,place_dict,Mots_expo,CodeExt)
+            nattributed = moulinette2[~moulinette2["Attribution finale"].notnull()]
+            attributed = moulinette2[moulinette2["Attribution finale"].notnull()]
+            get_attrib_score(attributed,nattributed)
+        except Exception as e:
+            print(e)
+            print("pas de feuille exposÃ© sommaire")
+        
+        print("###############\n"*5)
+        print("Codes qu'il manque au niveau de la moulinette")
+        print("###############\n"*5)
+        missing_code(moulinette2)
+        moulinette2.to_csv("../attribution_finale.csv")
+        ecrire_resultat(moulinette_location)
+        tk.messagebox.showinfo("Information","TerminÃ©, ouvrir le fichier logs.txt pour plus d'informations, bon courage Ã  tous et toutes! Joseph")
+    
+    def afficher_aide(self):
+        aide_window = tk.Toplevel(self.master)
+        app = AideWindow(aide_window)
+
+if __name__ == "__main__":
+    root = tk.Tk()  # CrÃ©ation de l'instance de Tk
+    app = TrieurAmendementsDLF(root)  # CrÃ©ation de l'instance de la classe TrieurAmendementsDLF
+    root.mainloop()  # Lancement de la boucle principale d'Ã©vÃ©nements de Tk
\ No newline at end of file