Generation de urls-*.txt par type de structure publique
Created by: mfaure
Actuellement le fichier urls.txt
(produit par script/http_check
) regroupe en un seul fichier toutes les URLs de tous les fichiers sources/*.txt
.
C'est pratique si on chercher à lister toutes les URLs, ça l'est moins si cherche uniquement les URLs des communes ou des EPCI ou des préfectures, etc.
L'objet de cette PR est d'ajouter dans le dépôt les fichier urls-X.txt
et domains-X.txt
les sous-ensembles suivants :
- academies
- ambassades
- aphp
- centre-de-gestion
- collectivites
- communes
- conseils-departementaux
- conseils-regionaux
- epci
- etablissements-scolaires
- gouvfr-divers
- hopitaux
- mdph-mda
- nongouvfr-divers
- prefectures
- sante-fr
- universites
L'intérêt d'avoir ces fichiers est de mettre à disposition des fichiers d'URLs (pas domaine) directement (ré)utilisables.