Suppression de doublon, et récupération de données éclatées en lignes

Bonjour à tous, et merci pour toute l'aide que vous nous apportez.

Dans mon exemple en pièce jointe, nous aimerions supprimer les doublons de la colonne AF ( en bleu) tout en gardant toutes les infos des cases AG à AW, qui peuvent être différente.

Par exemple dans l'exemple de la 1ère ligne, nous aimerions ne garder qu'une ligne qui inclurait les infos de la case AG2 et celles de AG3 à AW3.

Mais aussi à supprimer la ligne en doublon si tous les éléments se répètent, comme pour les lignes AF48 à AW48 et AF49 à AW49

Notre but est donc de récupérer toutes les informations qui se sont dispatchées en 2 lignes sur une seule et même ligne, sans rien perdre, et en éliminant les doublons inutiles, et afin d'avoir un fichier d'exportation d'une ligne par ref "Concater".

Quitte même si possible à concaténer tous les éléments de chaque case des 2 lignes, dans une seule et même case.

Et si par hasard, une 3eme et une 4eme ligne avait été générée, il faudrait aussi que tous les éléments convergent en une seule ligne.

Notre fichier de travail comporte +/- 270 000 lignes.

J'espère avoir été claire dans mon explication et j'espère qu'une solution existe et que l'un ou l'une d'entre vous pourra nous aider.

Par avance, merci,

Cordialement,

Amélie

17exemple-base.xlsx (37.16 Ko)

Bonjour à tous !

Que doit-on faire du champ "Code client" ?

J'ai remarqué que pour des enregistrements que vous considérez comme étant à regrouper, ce champ pouvait contenir des informations différentes.

Ce champ doit être ignoré ? Concaténé ?

image

Hello, JFL, Lilas,

En effet je me pose la même question que JFL mais je regarderai après pour la partie à gauche de ton concatener.

Première étape : traitement de la partie droite donc tes 15 colonnes de libellés est ce que ce serait ça l'attendu ?

Je te remercie d'avance

@+

18exemple-base.xlsx (51.08 Ko)

Merci BAROUTE 78 et JFL.

Effectivement il y a un soucis au niveau du code client, qui résulte simplement d'un copie collé, en série.

J'ai laissé les infos pour voir l'ampleur du tableau, mais elle n'ont pas incidence dans mon exemple, elles peuvent être ignorées.

Effectivement le résultat de Baroute78 semble bien être celui attendu :)

Je suppose qu'il est question de condition et de concatener, mais ça m'a l'air beaucoup plus complexe.

Encore merci à l'avance, pour votre aide,

Cordialement,

Amélie

Bonjour à tous !

Je vous livre une proposition Power Query.

J'ai inséré un tableau structuré ("t_BDD") et, dans la requête, j'ai supprimé les champs "Code Client", "Doublon" et "concatener".

Sur la base d'une certaine homogénéité des champs à concaténer (commençant par "Libelle" ou Operation"), la requête devrait être dynamique.

J'ai opté pour "|" comme élément séparateur des valeurs concaténées. On peut faire un choix différent.

Hello JFL,

Bien plus propre que ma version, je n'ai pas tout compris sur l'étape "Group By" je vais m'y pencher mais c'est carré ce que tu as fait

Bonne journée

Rechercher des sujets similaires à "suppression doublon recuperation donnees eclatees lignes"