Traîtement de données VBA? PowerQuery?

Bonjour

J'ai essayé de travailler sur une base de données de 200 000 lignes pour extraire quelques informations, mais je bloque au niveau d'une étape. Je vais essayer d'être précis dans ce que je souhaites avoir. J'ai mis comme PJ un fichier Excel qui contient un petit échantillon de base.

Par exemple si je filtre sur la première colonne la valeur "E00416", et au niveau de la deuxième sur la valeur "E20" (deuxième colonne", je souhaiterai avoir le nombre de fois que les données de la colonne 3 sont répétées. J'ai réussi cette étape avec Power Query, en faisant "Regrouper par" --> "Compter les lignes".

C'est la que les choses se compliquent pour moi, car j'essaye de faire un petit calcul. je vais donner un exemple de ce que je cherche:

Pour la valeur "E00416" (première colonne) et pour "E20" (deuxième colonne) je souhaite faire une somme totale du nombre de répétitions des donnés de la troisième colonne (SW, SE, FA et FM sont les 4 valeurs possibles dans la troisième colonne). Dans le cas de "E00416" le nombre total est de 5. Ensuite je souhaite calculer des pourcentages:

Somme(SW+FA+SE)/5 et (nombre de répétitions de FA /5)

Je souhaite faire ce traitement pour chaque valeur de la première colonne N_C

Pour informations, les valeurs de la colone C_ETAB sont uniques pour chaque valeur de la première colonne N_C.

J'espère que j'ai été assez clair... et je vous remercie d'avance pour votre aide

Cordialement

Bonjour,

Un peu confus !...

Donne des exemples de résultats.

Cdlt.

Bonjour

Ce n'est pas très clair..

Tu parles des colonnes 1 et 2 pour compter la troisième mais tu regroupes sur les 4 ce qui théoriquement fausse

Tu as 7 fois "E00416" dans la source et non 5, indépendamment des autres colonnes

Tu veux compter le nombre de SW, FA +SE mais là tu ne parles plus de la seconde colonne

Bref on ne comprend ce que tu veux compter...

Edit : salut Jean-Eric plus rapide mais en phase !

Bonjour,

Un peu confus !...

Donne des exemples de résultats.

Cdlt.

Bonjour Jean-Eric et 78chris

Tout d'abord merci d'avoir pris le temps de lire mon sujet, et je suis désolé pour cette confusion

J'ai mis un nouveau fichier en PJ.

J'ai fait un premier traitement sur les donnés de la première feuille en faisant "Regrouper par" --> "Compter les lignes".

J'ai donc obtenu les résultats de la seconde feuille de calcul. Le premier résultat par exemple veut dire que pour "E00416" , et "E20", la valeur "SW" est répétée 3 fois. Pour "E00416" et "E4V", la valeur "FA" est répétée 3 fois , ainsi de suite.

-->Ce que je souhaite avoir, ( je vais me baser sur le même exemple "E00416"), c'est les calculs suivant:

Si je filtre sur "E00416" et "E20", j'aurai un totale de 7 répétitions

je souhaite faire la somme(SW+FA+SE)/7 ce qui est égale à 6/7

le nombre de répétitions de FM divisé par 7, ce qui est égale à 1/7 (toujours avec le même filtre "E00416" et "E20").

-->Ensuite en prenant "E00416" et "E4V", j'aurai 1 FM et 1 FA, le totale de répétitions est égale à 2.

somme( SW+SE+FA)/2= 0+0+1/2=1/2

nombre de répétitions FA/2=1/2

Ainsi de suite, je souhaite faire ces calculs pour chaque binôme de la colonne 1 et 2

J'espère que j'ai été plus clair cette fois-ci, et désolé encore une fois pour cette confusion..

Cordialement

Bonjour Leo10Messi,

Voyez si le fichier joint peut vous aider, je ne suis pas sur d'avoir tout compris

=SI(ESTNUM(EQUIV(CONCATENER(A2;B2;C2);E$1:E1;0));"";CONCATENER(A2;B2;C2))
=SI(E2="";"";SOMME(NB.SI.ENS(A:A;A2;B:B;B2;C:C;"FA");NB.SI.ENS(A:A;A2;B:B;B2;C:C;"SE");NB.SI.ENS(A:A;A2;B:B;B2;C:C;"SW"))/NB.SI.ENS(A:A;A2;B:B;B2))
=SI(E2="";"";NB.SI.ENS(A:A;A2;B:B;B2;C:C;"FA")/NB.SI.ENS(A:A;A2;B:B;B2))

Bonjour Leo10Messi,

Voyez si le fichier joint peut vous aider, je ne suis pas sur d'avoir tout compris

=SI(ESTNUM(EQUIV(CONCATENER(A2;B2;C2);E$1:E1;0));"";CONCATENER(A2;B2;C2))
=SI(E2="";"";SOMME(NB.SI.ENS(A:A;A2;B:B;B2;C:C;"FA");NB.SI.ENS(A:A;A2;B:B;B2;C:C;"SE");NB.SI.ENS(A:A;A2;B:B;B2;C:C;"SW"))/NB.SI.ENS(A:A;A2;B:B;B2))
=SI(E2="";"";NB.SI.ENS(A:A;A2;B:B;B2;C:C;"FA")/NB.SI.ENS(A:A;A2;B:B;B2))

Leo10Messi-TRAITEMENT DONNEES 280719.xlsx

Bonjour njhub,

Merci pour votre retour, mais les chiffres ne me semblent pas correctes.

J'ai envoyé un post juste avant le votre dans lequel j'explique le détail des calculs

Merci

Cordialement

RE

J'ai tenté par TCD (sans PowerQuery) selon ce que je comprends...

RE

J'ai tenté par TCD (sans PowerQuery) selon ce que je comprends...

Re bonjour

Voici un fichier en PJ dans lequel j'ai fait quelques calculs manuellement. C'est dans la feuille "STATS", colonnes H,I,J,K,L,M,N.

Ça permettrait peut-être de mieux visualiser le schéma

Désolé encore une fois

Merci d'avance

Cordialement

Bonjour Leo10Messi,

Voyez si le nouveau fichier joint peut vous aider

RE

Si je prends tes nouvelles données les ratios du TCD sont bons

RE

Si je prends tes nouvelles données les ratios du TCD sont bons

Merci à toi et à njhub pour vos retour

les résultats semblent corrects

Par contre, est-ce qu'un TCD est applicable pour une base de données de plus de 200 000 lignes? voire plus?

Merci

Re,

Et 1 solution Power Query et un TCD.

Cdlt.

Re,

Et 1 solution Power Query et un TCD.

Cdlt.

TRAITEMENT DONNEES 280719b.xlsm

Re,

merci pour ton retour, ça fonctionne parfaitement , j'ai remplacé les anciennes données par les 236 K lignes de ma base et j'ai actualisé.

J'aurai 2 questions à te poser stp

1) Est-ce qu'un TCD a une limite au niveau du nombre de données à traiter ?

2) Peux-tu me rajouter quelques commentaires s'il te plait dans le fichier, afin de comprendre comment tu as fait pour résoudre ce problème? j'ai regardé les étapes dans Power Query mais honnêtement je n'ai pas tout compris. Ça serait gentil de ta part.

Merci encore une fois pour ton aide

Cordialement

Bonjour à tous

Il faudrait comparer le temps de traitement mais le TCD seul suffit à mon avis et peut mouliner 200 000 lignes

Re,

Bonjour 78Chris,

On est bien d'accord, pas de nécessité absolue d'utiliser Power Query dans ce cas.

Cdlt.

Merci à tous pour vos réponses

Bonne soirée

Cordialement

Rechercher des sujets similaires à "traitement donnees vba powerquery"