POWER QUERY - Supprimer doublons incomplet

Hello

J'ai une petite problématique sous Power Query (Power BI). J'ai une source de données qui provient d'une DB salesforces.

Je récupère les champs suivants:

* Customer Number

* Sales Org

* Customer grouping

Dedans j'ai pas mal de vrai doublons (sur les 3 champs) donc là RAS pour supprimer ces derniers.

Par contre j'ai d'autres lignes qui sont des doublons uniquement pour les champs "Customer Number" et "Sales Org" mais pas sur le "customer grouping" qui est soit vide, soit avec un nom de groupement.

Je souhaiterai donc dans ce second cas de figure, garder la ligne pour laquelle le "Customer grouping" est non vide et supprimer les autres lignes qui matchent pour les champs "Customer Number" et "Sales Org".

Le but final est d'avoir une source avec le "Customer Number" comme clef primaire (aucun doublon).

Mais je galère à faire ces 2 étapes en une.

De l'aide serait grandement appréciée

Merci

Bonjour à tous !

Présentement 155 messages à votre actif mais aucun classeur joint......

Vous ne mettez pas toutes les chances de votre côté.....

Bonjour JFL

En effet mais étant donné qu'il s'agit d'une grosse DataBase et à fortiori confidentielles, pas simple de partager un fichier.

Du coup j'ai créé un petit modèle ci-joint:

Onglet INITIAL: point de départ

Onglet FINAL: Ce que je souhaiterai obtenir

20classeur1.xlsx (10.99 Ko)

Bonjour à tous de nouveau !

Une proposition ?

Hello

Cela fonctionne nickel par contre je ne pige pas tout dans ton code.

Peux-tu détailler un peu plus ce qu'il fait? tu groupes sur le sold-to et tu crées une table intermédiaire reprenant les 3 champs? et ensuite?

let
    Source = Excel.CurrentWorkbook(){[Name="t_Initial"]}[Content],
    GroupBy = Table.Group(Source, {"Sold-To"}, {{"tbl", each Table.FirstN(Table.Sort(_,{"CDD EU Customer Grouping", Order.Descending}),1), type table [#"Sold-To"=text, Sales Org=text, CDD EU Customer Grouping=text]}}),
    Expand_tbl = Table.ExpandTableColumn(GroupBy, "tbl", {"Sales Org", "CDD EU Customer Grouping"}, {"Sales Org", "CDD EU Customer Grouping"})
in
    Expand_tbl

ps: je ne suis pas expert power query (loin de là)

Bonjour à tous de nouveau !

L'étape GroupBy encapsule 3 traitements :

1/ Création d'une table liée à l'élément de regroupement
2/ Tri de cette table sur le champ "CDD EU Customer Grouping"
3/Extraction de la 1ère ligne de cette table.

Voir le fichier joint détaillant chaque étape.

"ps: je ne suis pas expert power query (loin de là)"

Moi non plus !

Re

Ok mais du coup quand on a plusieurs ligne avec un même "customer number" mais dans un le champ "CDD EUR Customer Grouping" une seule de ces lignes est non vide, comment être sûr qu'elle soit en première position afin de la récupérer en phase 3?

C'est grâce à ton "Order.Descending" de la phase 2?

Bonjour à tous de nouveau !

Ok mais du coup quand on a plusieurs ligne avec un même "customer number" mais dans un le champ "CDD EUR Customer Grouping" une seule de ces lignes est non vide, comment être sûr qu'elle soit en première position afin de la récupérer en phase 3?

C'est grâce à ton "Order.Descending" de la phase 2?

Absolument.

Rechercher des sujets similaires à "power query supprimer doublons incomplet"