Skip to content

Generation de urls-*.txt par type de structure publique

Created by: mfaure

Actuellement le fichier urls.txt (produit par script/http_check) regroupe en un seul fichier toutes les URLs de tous les fichiers sources/*.txt.

C'est pratique si on chercher à lister toutes les URLs, ça l'est moins si cherche uniquement les URLs des communes ou des EPCI ou des préfectures, etc.

L'objet de cette PR est d'ajouter dans le dépôt les fichier urls-X.txt et domains-X.txt les sous-ensembles suivants :

  • academies
  • ambassades
  • aphp
  • centre-de-gestion
  • collectivites
  • communes
  • conseils-departementaux
  • conseils-regionaux
  • epci
  • etablissements-scolaires
  • gouvfr-divers
  • hopitaux
  • mdph-mda
  • nongouvfr-divers
  • prefectures
  • sante-fr
  • universites

L'intérêt d'avoir ces fichiers est de mettre à disposition des fichiers d'URLs (pas domaine) directement (ré)utilisables.

Merge request reports

Loading