Extraction données pdf vers tableau Excel

Bonjour,

je suis débutante en VBA mais j'ai absolument besoin d'écrire un code pour extraire les données depuis les fiches pdf vers le tableau excel. J'ai ai environ 200 fiches cela sera donc un énorme preneur du temp

47520-063358.pdf (10.71 Ko)
219aop-results.xlsx (12.98 Ko)

s pour faire ce travail manuellement. En effet dans les fiches à gauche j'ai les noms de paramètres et à droite les chiffres et le texte à copier et insérer dans le tableau. J'ai essayé d'écrire un code en me basant sur les précédentes discussions mais je n'ai pas réussi à le faire fonctionner. Je vous joins le tableau excel que j'ai commencé à remplir manuellement et une des fiches pdf. D'avance merci de votre aide !

Bonjour et bienvenue,

Une question :

Tu disposes de Power Query avec Excel 2016.

Peux-tu regarder si tu l'option A partir du PDF est présente dans le ruban ?

Le chemin est : Ruban, Données, récupérer et transformer des données, A partir d'un fichier, A partir du PDF.

Cdlt.

Bonjour, merci pour votre retour. J’ai regardé - non il n’y a pas « a partir de pdf », par contre il y a autres sources :access, text , web etc ...

Re,

Il faut donc posséder Excel 365 pour disposer de cette fonctionnalité.

Je ne peux donc pas t'aider.

J'avais préparé un exemple avec ton pdf (en pensant pouvoir attaquer un dossier complet),

Cdlt.

788import-pdfs.zip (30.06 Ko)

Merci Jean-Eric. Est-ce microsoft 365 est difficile d'obtenir? puis je télécharger une version gratuite /d'essai ?

Re,

Regarde le site de Microsoft 365.

Sinon, peux-tu joindre d'autres PDFs que je puisse valider ma proposition initiale.

Il faut que tous les PDFS soient identiques (tables) ?

Cdlt.

Bonjour Jean-Eric, en effet tous les pdf sont identiques oui c'est seulement les chiffres et le texte qui change. Est-ce que cette extraction fonctionne bien sur microsoft 365 et assez facile à faire (vu que j'en ai env 200 fois à faire)? Je n'ai pas encore réussi à installer le microsoft excel mais je vais continuer à chercher les moyens comment l'avoir si ça fonctionne bien là dedans

Voici une autre fiche pdf

16720-063359.pdf (9.23 Ko)

Bonjour,

Il va falloir envoyer d'autres PDFs.

Si ces 2 fichiers paraissent semblables (visuellement), ils ne le sont pas tout à fait.

Avant d'aller plus loin, il est nécessaire d'avoir un échantillon plus important pour déterminer si on peut automatiser la transformation des PDFs. sans perte d'informations.

Cdlt.

Je pense qu'une moulinette est faisable car tes fiches PDF ne sont pas des bitmaps. Je t'ai envoyé un MP pour que tu me fasses parvenir toutes tes fiches.

Ensuite, il n'y aura plus qu'à...

Voici ce que je voulais faire avec mes outils :

A - relier tous les PDF à l'aide de PDF Sam Basic

B - soumettre le PDF créé à pdf2go

C - exporter le fichier sous Excel au format CSV

D - fabriquer une moulinette pour remettre les 200 fiches en tableau.

Ces fiches étant confidentielles, je ne peux plus faire grand-chose. Dommage.

Pour moi, la moulinette fonctionne, mais comme un problème de confidentialité se pose, ce sera à toi de préparer ton propre fichier .CSV

J'en ai fait un en reliant les deux fiches PDF que tu nous avais fournies, transformées au format Excel sur pdftoexelconverter.net

A partir de là, il faut sauvegarder le fichier Excel téléchargé au format CSV avec le " ; " comme séparateur, puis remplacer les " ; " par des " , " sous Notepad++ et le sauvegarder sous le nom fichier.csv

Le fichier de données (.CSV) doit être dans le même dossier que le fichier .XLSM avant de lancer la macro.

Elle va remplir ton tableau. Tu feras attention, parce que l'exemple de tableau XLS que tu nous avais donné ne correspond pas tout à fait à l'ordre des champs dans les fiches PDF et il manquait un champ important (l'auteur du prélèvement). C'est la feuille du fichier ci-dessous qu'il faudra utiliser.

Il doit y avoir probablement d'autres soluces, c'en est une.

260analyses-bio.xlsm (20.61 Ko)
135fichier.csv (2.09 Ko)

Bonjour Optimix, merci d'avoir partagé ta solution. J'avais fait les premières étapes mais je suis bloquée ici : "puis remplacer les " ; " par des " , " sous Notepad++ et le sauvegarder sous le nom fichier.csv"

Dans le notepad (je n'ai pas notepad++ mais simplement notepad) quand j'ouvre le fichier .csv, il n'y pas de ";" à remplacer. Je ne sais pas donc si j'ai bien compris le raisonnement.

Remplace définitivement ton Notepad par Notepad++. C'est gratuit et bien supérieur à cette antiquité de Microsoft.

Dans les formats de sauvegarde proposés par Excel, tu as CSV séparateur ";" (csv)

Tu as bien compris le process.

sauvegarde

Bonjour Line88,
Il n'y a pas de programmes parfaits pour extraire les informations d'un fichier PDF, mais pour ma part j'utilise PDF Shaper (pdfshaper.com). Il existe une version gratuite qui devrait suffire à tes besoins.

Avec PDF Sharper, tu peux convertir plusieurs fichiers PDF en textes en quelques secondes.

1. Sélectionne tous les fichiers PDF de résultats et tu les glisses dans le PDF Sharper.

2. Tu sélectionnes l'icone "PDF en TXT" ensuite tu t'assures que l'option "Préserver mise en page du texte" est sélectionné.

3. Finalement clique sur le bouton "Procéder", ce qui convertira tous les fichiers PDF que tu as choisi en 1. en fichier texte.

4. J'ai ajouté un bouton à ton fichier qui permet d'extraire les résultats de un ou plusieurs fichiers texte.

262aop-results.xlsm (28.04 Ko)

Convertir l'ensemble de tous les fichiers devrait être rapide. (Le fichier contient déjà 2 ligne fait à partir de tes fichiers PDF.

Rino702

bonjour Rino, merci beaucoup. J'ai téléchargé le pdf shaper effectivement il permet bien d'extraire les données vers le notepad mais quand je sélectionne après ces données, les noms de paramètres sont sélectionnées aussi et moi j'ai uniquement besoin de chiffres (colonne droite). La macro ne fonctionne pas pour moi avec le fichier txt j'ai enregistré avec pdf shaper. Je devrai réessayer encore une fois peut être

Rechercher des sujets similaires à "extraction donnees pdf tableau"