Générateur de formules pour les extractions de données

Bonjour à tous,

Je développe actuellement un nouvel utilitaire pour le site, un générateur de formules pour les extractions

Pour mieux comprendre l'idée, voici un exemple simple


Vous avez une colonne de données contenant des numéros de référence dont voici un extrait :

A-31-D
B-42-B
C-55-D
D-21-W

Et vous voulez par exemple connaître la formule pour extraire les chiffres au milieu ...

Dans ce cas, copiez-collez simplement les cellules (en une fois) dans l'utilitaire :

outil extractions

Renseignez 2 champs avec les résultats attendus (ici, les chiffres) :

outil extractions donnees formule stxt

La formule sera ensuite affichée immédiatement et la colonne de droite complétée pour en avoir un aperçu (pour autant bien sûr que l'algorithme ait trouvé une solution au problème).


Pour le moment, l'outil est capable de proposer des formules pour une première série de cas ...

Par exemple, des formules simples avec GAUCHE ou DROITE :

outil extractions donnees formule gauche

Il gère aussi quelques premiers cas un peu plus complexes (comme ici en récupérant les données moins 2 caractères de chaque côté à l'aide de la fonction REGEXREPLACE) :

outil extractions donnees formule regexreplace

Ou encore quelques cas particuliers comme l'extraction de tous les chiffres :

outil extractions donnees formule chiffres

L'outil ne peut pas encore être testé, je dois encore ajouter un certain nombre de "cas" avant de le proposer sur le site ...

Mais en attendant, votre avis est le bienvenu

Si vous pouvez copier-coller quelques cellules et entrer 2 valeurs pour (peut-être) obtenir sans efforts la formule d'extraction, pensez-vous l'utiliser ?


EDIT : l'outil est en ligne (avec un exemple d'utilisation)

Version pour Google Sheets :
https://www.sheets-pratique.com/fr/utilitaires/formule-extraction

Version pour Excel :
https://www.excel-pratique.com/fr/utilitaires/formule-extraction

Bonjour Sébastien,

A-31-D
B-42-B
C-55-D
D-21-W

Et vous voulez par exemple connaître la formule pour extraire les chiffres au milieu ...

Dans ce cas, copiez-collez simplement les cellules dans l'utilitaire :

Renseignez 2 champs avec les résultats attendus (ici, les chiffres) :

outil extractions donnees formule stxt

Il gère aussi quelques premiers cas un peu plus complexes (comme ici en récupérant les données moins 2 caractères de chaque côté à l'aide de la fonction REGEXREPLACE) :

outil extractions donnees formule regexreplace

Mais en attendant, votre avis est le bienvenu

Alors là, c'est un niveau assez élevé ! et certainement très utile en effet !

  1. J'aime beaucoup l'aide sur les regex, d'autant que c'est une fonction souvent "mal aimée" ici, un peu trop souvent oubliée (en excel surtout).
  2. Autre registre, je serais particulièrement friand d'explication sur les XPath, mais je peux m'en occuper d'ici un temps qui reste à déterminer car ce n'est pas très simple et pas encore suffisamment clair pour moi !
  3. Et j'apprécie beaucoup ton chapitre sur query qui arrive en tête des recherches sur google et que j'utilise !

Dans le premier cas cité, on pourrait aussi faire

={"nb";query(arrayformula(split(A2:A5;"-"));"select Col2")}

avec une seule formule en-tête de colonne, ce que j'apprécie particulièrement dans GS

de quoi s'entraîner car cela peut être utile comme ici https://forum.excel-pratique.com/excel/importation-donnees-geny-courses-150151#p929997

Une formule comme cela, Tulipe devrait aimer ...

Autre registre, je serais particulièrement friand d'explication sur les XPath

Je ne vais pas pouvoir t'aider pour ça, tu connais bien mieux ce sujet que moi

Et j'apprécie beaucoup ton chapitre sur query qui arrive en tête des recherches sur google et que j'utilise

Dans le premier cas cité, on pourrait aussi faire

={"nb";query(arrayformula(split(A2:A5;"-"));"select Col2")}

On peut aussi juste ajouter ARRAYFORMULA à la formule :

=ARRAYFORMULA(STXT(A1:A4;3;2))

L'outil gère maintenant un nouveau cas supplémentaire, l'extraction en fonction d'un séparateur (ici le 3e groupe) :

outil extractions donnees formule google sheets

Et en plus, ce sera aussi utilisable avec Excel + les fonctions REGEX du pack

outil extractions donnees formule excel

Ou encore plus tordu, l'extraction de l'avant-avant-dernier groupe de données d'une chaîne de caractères (avec un séparateur qui peut ici se répéter) :

outil extractions donnees separateur google sheets

Autrement dit, la plupart des tests sont effectués par la gauche puis par la droite (et dans ce cas, seule la recherche par la droite donne un résultat).


Vous verrez, c'est magique

Un copier-coller + 2 champs complétés et la formule apparaît toute seule

Le dernier ajout est probablement le plus intéressant et le plus complexe, celui de la reconnaissance de motifs

Dans cet exemple-ci, l'algorithme arrive à trouver un motif qui permet d'extraire l'âge :

outil extractions donnees regexextract google sheets

Un autre motif plus complexe que le précédent trouvé par l'algorithme en 0.045 secondes :

fonction regexextract google sheets

Je mettrai l'utilitaire en ligne prochainement ...

Nouveau : l'outil propose également la formule avec ARRAYFORMULA

outil extractions donnees formule regexextract arrayformula

L'outil sera bientôt en ligne

L'outil est en ligne (avec un exemple d'utilisation)

Version pour Google Sheets :
https://www.sheets-pratique.com/fr/utilitaires/formule-extraction

Version pour Excel :
https://www.excel-pratique.com/fr/utilitaires/formule-extraction

Rechercher des sujets similaires à "generateur formules extractions donnees"