Merge sources/* to domains.csv
TODO :
-
Prendre en compte les commentaires de sources/*.txt
(lignes avec des#
). -
Mettre à jour check.py
-
Mettre à jour sort.py
-
Mettre à jour le README. -
Mettre à jour les scripts d'insertion.
Alors, j'ai pris une liberté : j'ai mergé sources/*
dans domains.csv
plutôt que créer encore un nouveau fichier (et oui je suis toujours ouvert à la discussion). Les « colonnes » sont donc :
$ head -n 1 domains.csv
name,http_status,https_status,SIREN,type,sources,script
J'ai versionné scripts/convert.py
qui fait la convertion, je ne pense pas que ce soit nécessaire.
J'ai surtout besoin de relecture côté « choix des mots », dans convert.py
j'ai :
pretty_names = {
"academies.txt": "Académie",
"ambassades.txt": "Ambassade",
"aphp.txt": "APHP",
"centre-de-gestion.txt": "Centre de gestion",
"collectivites.txt": "Collectivité",
"communes.txt": "Commune",
"conseils-departementaux.txt": "Conseil départemental",
"conseils-regionaux.txt": "Conseil régional",
"epci.txt": "EPCI",
"etablissements-scolaires.txt": "Établissement scolaire",
"gouvfr-divers.txt": "Gouvernement",
"hopitaux.txt": "Hôpital",
"mdph-mda.txt": "MDPH ou MDA",
"nongouvfr-divers.txt": "",
"prefectures.txt": "Préfécture",
"sante-fr.txt": "Santé",
"universites.txt": "Université",
}
J'ai aussi :
return "Ajout manuel de " + get_commit_author(commit)
Je pense que tout le monde ne veut pas voir son nom ici répété des milliers de fois, moi le premier, mais je manquais d'inspiration pour les ajouts manuels. On peut se contenter de « Ajout manuel », l'auteur est dans le git log de toutes façons ?
Pour expérimenter j'ai implémenté :
On peut imaginer une option --json
si un jour quelqu'un veut un export json, qu'on est pas obligé de versionner.