Liste de noms de domaine de la sphère publique
Ce dépôt contient une liste de noms de domaine d’organismes remplissant des missions de service public.
La liste des noms de domaines
Le fichier domains.csv
contient les domaines connus, qu’ils soient
accessibles en HTTP ou non, qu’ils exposent un MX ou non, etc.
C'est le seul fichier modifiable manuellement, les ajouts et suppressions s’y font soit manuellement, soit via des scripts de collecte (voir Contribution).
Les colonnes de domains.csv
sont les suivantes :
-
name
: Le nom de domaine -
http_status
: la réponse à une requête http 80 ou vide -
https_status
: la réponse à une requête http 443 ou vide -
SIREN
: Le numéro SIREN de l'établissement ou vide -
type
: Le type d'établissement ou vide -
sources
: La source de la donnée -
script
: Le nom du script de collecte qui a ajouté l'entrée
La liste des URLs
Le fichier urls.txt
est une liste d’URLs basée sur les domaines du
fichier domains.csv
et répondant 200 OK
en HTTP ou en HTTPS
éventuellement après une redirection sur le même domaine
(typiquement l’ajout d’un /fr/
).
Les ajouts et suppressions s’y font automatiquement, il n’est pas nécessaire de modifier ce fichier manuellement.
Attention, cette liste étant basée sur des noms de domaines d’organismes publics, il n'est pas possible pour des URL d’organismes publics hébergés sur des domaines privés comme https://sites.google.com/site/mairiedemacey/ d’y figurer.
Contribution
Ajoutez le ou les domaines que vous connaissez dans le fichier
domains.csv
.
Pré-requis pour utiliser les scripts python :
pip install -r scripts/requirements.txt
Ce fichier doit rester trié, pour le trier automatiquement utilisez :
python scripts/sort.py
Pour vérifier que tout va bien avant de commit :
python scripts/check.py