Extraire mots d'un fichier word ou PDF et créer une liste avec ces mots

Bonjour à tous,

Débutante ... j'épluche depuis la semaine dernière ce site en ce qui concerne la création de macro sur excel mais je n'arrive pas à créer de connexion entre ce qui y est proposé et la tâche que l'on m'a confiée ... c'est compliqué de partir de rien ....

Pour le boulot, il m'a été demandé de créer ce qui suit, sachant que je ne peux pas partager les documents de mon entreprise je vais essayer d'être le plus clair possible :

j'ai deux fichiers :

  • un excel avec une base de données de mots qui sont interdits à l'emploi
  • des fiches de consigne (environs 900 pages) spécifiques à mon activité qui peut être sous Word ou PDF, j'ai le choix..

Parmi les mots interdits, j'ai pour consigne de ne m'occuper que des mots en minuscule, je dois les identifier et sortir une liste de ces mots avec leur numéro de page afin que le correcteur puisse contrôler seulement les pages ou il y a un soucis.

la base de donnée ressemble à ça :

colonne A :

aider (v)

grandir (v)

CALCULER (V)

voici mon plan :

1- Créer une première liste des mots à identifier dans la fiche de consigne :

Deux conditions :

  • Formule pour que ne soit pris en compte que le texte avant l'espace
  • Formule pour que ne soit pris en compte que le texte en caractère minuscule

2- Comparer cette liste avec la fiche de consigne en PDF ou word 'la je ne vois pas encore comment faire ...

3- Entrer dans une table le résultat en associant le numéro de page

Voici mes questions :

Pouvez vous me dire si déjà, ma logique est bonne svp?

Connaissez vous une formule pour ne prendre en compte que le texte en minuscule? j'ai essayé de mettre une condition avec Lcase mais je n'ai pas réussi ...

Du pdf ou du word, quel est le support le plus approprié à votre avis pour réaliser un extract? Est ce que la fiche de consigne word ou pdf doit être ouverte pour pouvoir être analyser par la macro?

J'ai la semaine pour plancher la dessus, je vous partagerais mon résultats (si je le trouve!!!)

Je sais que c'est un gros morceau ... je vous remercie d'avance pour m'avoir lue et pour vos conseils avisés

Nini12345

Bonjour,

ici c'est un forum Excel alors pour Word je peux pas te dire...

Mais je que je peux te dire c'est qu'avec un pdf tu ne pourras sans doute pas faire grand chose !

A+

Bonjour Galopin,

Merci pour ton retour, du coup je suis en train d'essayer de déchiffrer et d'adapter à ma situation la macro postée sur la discussion : "Recherche des mots excel dans word" dans ce même forum. J'y suis presque!

Il me reste seulement le souci pour distinguer les mots en minuscule et ceux en majuscule, j'ai trouvé une astuce avec le code des caractères mais je pense que je peux encore optimiser!

Effectivement je suis partie sur un extract à partir de word et non de pdf

Si j'ai un beau résultat je vous le posterais

Nini

Bonjour,

A première vue ça me semble difficile de "scanner" 900 pages avec les moyens d'Excel surtout si tu dois passer par le code de caractère.

Seul ACCESS (je crois...) est capable de différencier un mot en majuscule et un autre en minuscule.

Peut-être aussi SQL mais je ne suis pas assez costaud sur ce terrain là. Peut-être un spécialiste es SQL e peut-il ?

A+

Suite à la discussion : https://forum.excel-pratique.com/viewtopic.php?f=2&t=125070&p=775039#p775039

pour distinguer majuscule et minuscule, dans le code donné sur l'autre fil, il suffit de spécifier .MatchCase = True

    .MatchWholeWord = True
    .MatchCase = True
    While .Execute
    ...

Pierre

il suffit de spécifier .MatchCase = True

Merci à vous

Bonjour à tous,

Du coup je suis en train d'essayer d'intégrer la condition matchcase à ma macro ... voici mon point de départ :

Sub import_dictionnaire()

Dim derligne As Long

derligne = Cells(Columns(1).Cells.Count, 1).End(xlDown).Row

Workbooks("STE_Dictionary.xlsx").Sheets("Feuil1").Range("A4:A" & derligne).Copy Range("A:A")

End Sub

La macro globale est très lourde (20 minutes à tourner à peu près...) serait ce plus intéressant de faire la recherche dans le word et de n'importer que les données dont on a besoin?

Comment intégrer la condition matchCase = true svp?

j'ai essayé avec un IF et un with mais je n'ose même pas vous monter ça ne fonctionne pas du tout!

merci d'avance,

Bonjour,

Du coup je suis partie sur une autre manière de faire après extract :

Je n'arrive pas à saisir pourquoi mon écriture ne fonctionne pas, j'ai l'erreur sub ou fonction non défini, pouvez vous m'éclairer sur la signification svp?

Merci beaucoup,

Sub gege()

Dim Lg As Integer, i As Integer

Lg = Cells(Columns(1).Cells.Count, 1).End(xlUp).row

For i = 1 To Lg Step -1

If Cells(i, 1).Font.Allcaps = True Then Row(i).EntireRow.Delete

Next i

End Sub

Rechercher des sujets similaires à "extraire mots fichier word pdf creer liste"