Données publiques ouvertes fichier trop volumineux

Bonjour,

J'ai téléchargé le "Répertoire National des Associations" sur Data.gouv.fr hier soir. Seulement, Excel ne veut pas l'ouvrir et je suis obligé de forcer à quitter à chaque fois. J'ai essayé de trouver des réponses sur des forums ou autres sans succès.

Le fichier pèse 952,3 Mo, est sous format .CSV

Je cherche les lignes correspondant au code postal commençant par 972.

Dans ce forum, pour des sujets similaires de "fichiers volumineux", il est beaucoup question de formules VBA. Le problème est que je ne m'y connais pas en VBA etc..

Aussi, est-ce que quelqu'un peut m'aider à ouvrir ce fichier ou du moins me donner une méthode, sachant que je compte télécharger d'autres données publiques ouvertes issues de ce site ?

J'espère avoir été clair.

Pour information, e ne peux pas ajouter le fichier compte tenu de son taille. (Fichier trop volumineux : rna_waldec_20191001.csv)

En revanche, je vous mets le lien et il s'agit du fichier RNA_waldec du 1er octobre 2019.

D'avance merci

Dans l'attente de vos retours,

Bien cordialement,

PS : MacBook Pro (13-inch, 2017, Two Thunderbolt 3 ports)

Excel version 16.30

Bonjour

effectivement le fichier récupéré est trop important pour excel il dépasse le nb de lignes qu'excel est capable d'ouvrir

Il faudrait passer par une importation dans Access ou tout autre gestionnaire de base de données

Cordialement

FINDRH

Bonjour,

Je n'ai pas access. Quel autre gestionnaire de données mes proposez vous ?

D'avance merci

Bonjour JEEPMICKAETPOLO, le forum,

En utilisant un éditeur libre de fichier CSV, tel que csved

téléchargeable à : https://csved.sjfrancke.nl/index.html

Vous pourrez "spliter" votre fichier en plusieurs parties gérables par votre tableur, et en extraire les données voulues.

Les mille et quelques premières lignes dans le fichier joint

18csved-972.xlsx (412.22 Ko)

Bonjour

La solution de njhub semble la plus simple et la meilleure

Pour ma part j'avais une solution plus artisanale pour scinder le fichier manuellement

  • ouvrir un classeur vide excel
  • faire une copie de sécurité du fichier compressé, la sélectionner et clic droit => ouvrir avec => Bloc Notes, le fichier complet s'ouvre
- sélectionner un paquet de lignes, couper puis coller dans le classeur excel

- j'ai limité la taille à 400 000 lignes

- par sécurité double enregistrement en xlsx et csv séparateur ;

- recommencer et faire autant de classeurs que nécessaire...

Pour finir, ouvrir un classeur vide excel

- menu donnée obtenir des données à partir d'un fichier

- explorateur==> ouvrir le fichier sélectionné

- outil scinder la colonne

- un peu de patience selon l taille et les données sont dispatchées dans des colonnes différentes !

- sauvegarder en xlsx

-reproduire l'opération autant que nécessaire

- faire une ligne d'en-tête cohérente et identique pour chaque classeur

Je t'avais prévenu, tous les chemins mènent à Rome.... le mien passe par le pôle sud mais j'y arrive !!!

Cordialement

FINDRH

Bonjour à tous,

Il me semble qu'il y a une autre manière de faire des recherches dans ce répertoire RNA, via son API.

Par exemple, si je veux les info pour les structures ayant le mot-clé "Fort-de-France" :

- il suffit de taper dans un navigateur quelconque l'adresse suivante :

https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France

-- Ah ben oui, mais c'est du json!?

- Pas de soucis, on copie le résultat au format "Données brutes" et on colle dans un convertisseur, comme par exemple : http://www.convertcsv.com/json-to-csv.htm

avec lequel on obtient directement (en un clic sur le bouton "JSON To Excel") un fichier excel contenant les données

-- Bon ok, mais là je n'ai que 10 lignes, et le reste alors?!

- T'inkiet, il est possible d'avoir 100 lignes par requête en écrivant l'adresse :

https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France?&per_page=100

-- Ben ok mais si j'ai besoin de plus de 100 lignes?!

- T'inkiet, on va chercher les pages suivantes, pour la page 2 ce sera :

https://entreprise.data.gouv.fr/api/rna/v1/full_text/Fort-de-France?&page=2?per_page=100

En bref, en jouant sur les mots-clé, le nb de résultats par page et le numéro de page, on peut récupérer les info souhaitées (via un convertisseur json-vers-excel)

Rq le nb max de lignes proposé par entreprise.data.gouv est de 100

Pour le reste des possibilités de requête, voir le mode d'emploi de l'API :

https://entreprise.data.gouv.fr/api_doc_rna

Simple - Basique

Pierre

Rechercher des sujets similaires à "donnees publiques ouvertes fichier trop volumineux"