Données publiques ouvertes fichier trop volumineux
Bonjour,
J'ai téléchargé le "Répertoire National des Associations" sur Data.gouv.fr hier soir. Seulement, Excel ne veut pas l'ouvrir et je suis obligé de forcer à quitter à chaque fois. J'ai essayé de trouver des réponses sur des forums ou autres sans succès.
Le fichier pèse 952,3 Mo, est sous format .CSV
Je cherche les lignes correspondant au code postal commençant par 972.
Dans ce forum, pour des sujets similaires de "fichiers volumineux", il est beaucoup question de formules VBA. Le problème est que je ne m'y connais pas en VBA etc..
Aussi, est-ce que quelqu'un peut m'aider à ouvrir ce fichier ou du moins me donner une méthode, sachant que je compte télécharger d'autres données publiques ouvertes issues de ce site ?
J'espère avoir été clair.
Pour information, e ne peux pas ajouter le fichier compte tenu de son taille. (Fichier trop volumineux : rna_waldec_20191001.csv)
En revanche, je vous mets le lien et il s'agit du fichier RNA_waldec du 1er octobre 2019.
D'avance merci
Dans l'attente de vos retours,
Bien cordialement,
PS : MacBook Pro (13-inch, 2017, Two Thunderbolt 3 ports)
Excel version 16.30
Bonjour
effectivement le fichier récupéré est trop important pour excel il dépasse le nb de lignes qu'excel est capable d'ouvrir
Il faudrait passer par une importation dans Access ou tout autre gestionnaire de base de données
Cordialement
FINDRH
Bonjour,
Je n'ai pas access. Quel autre gestionnaire de données mes proposez vous ?
D'avance merci
Bonjour JEEPMICKAETPOLO, le forum,
En utilisant un éditeur libre de fichier CSV, tel que csved
téléchargeable à : https://csved.sjfrancke.nl/index.html
Vous pourrez "spliter" votre fichier en plusieurs parties gérables par votre tableur, et en extraire les données voulues.
Les mille et quelques premières lignes dans le fichier joint
Bonjour
La solution de njhub semble la plus simple et la meilleure
Pour ma part j'avais une solution plus artisanale pour scinder le fichier manuellement
- ouvrir un classeur vide excel
- faire une copie de sécurité du fichier compressé, la sélectionner et clic droit => ouvrir avec => Bloc Notes, le fichier complet s'ouvre
- j'ai limité la taille à 400 000 lignes
- par sécurité double enregistrement en xlsx et csv séparateur ;
- recommencer et faire autant de classeurs que nécessaire...
Pour finir, ouvrir un classeur vide excel
- menu donnée obtenir des données à partir d'un fichier
- explorateur==> ouvrir le fichier sélectionné
- outil scinder la colonne
- un peu de patience selon l taille et les données sont dispatchées dans des colonnes différentes !
- sauvegarder en xlsx
-reproduire l'opération autant que nécessaire
- faire une ligne d'en-tête cohérente et identique pour chaque classeur
Je t'avais prévenu, tous les chemins mènent à Rome.... le mien passe par le pôle sud mais j'y arrive !!!
Cordialement
FINDRH
Bonjour à tous,
Il me semble qu'il y a une autre manière de faire des recherches dans ce répertoire RNA, via son API.
Par exemple, si je veux les info pour les structures ayant le mot-clé "Fort-de-France" :
- il suffit de taper dans un navigateur quelconque l'adresse suivante :
https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France
-- Ah ben oui, mais c'est du json!?
- Pas de soucis, on copie le résultat au format "Données brutes" et on colle dans un convertisseur, comme par exemple : http://www.convertcsv.com/json-to-csv.htm
avec lequel on obtient directement (en un clic sur le bouton "JSON To Excel") un fichier excel contenant les données
-- Bon ok, mais là je n'ai que 10 lignes, et le reste alors?!
- T'inkiet, il est possible d'avoir 100 lignes par requête en écrivant l'adresse :
https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France?&per_page=100
-- Ben ok mais si j'ai besoin de plus de 100 lignes?!
- T'inkiet, on va chercher les pages suivantes, pour la page 2 ce sera :
https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France?&page=2?per_page=100
En bref, en jouant sur les mots-clé, le nb de résultats par page et le numéro de page, on peut récupérer les info souhaitées (via un convertisseur json-vers-excel)
Rq le nb max de lignes proposé par entreprise.data.gouv est de 100
Pour le reste des possibilités de requête, voir le mode d'emploi de l'API :
https://entreprise.data.gouv.fr/api_doc_rna
Simple - Basique
Pierre