Supprimer doublons (selon 4 colonnes) et garder la date la plus ancienne

Bonjour à tous,

J'ai besoin de faire une manipulation me permettant de supprimer les doublons selon 4 colonnes et ne garder que la ligne avec la date la plus ancienne.

Je m'explique, j'ai un fichier excel avec environ 21k lignes. Parmis ces lignes se trouve des doublons. Or je veux les supprimer en ne gardant que le doublon le plus ancien. Je caractérise les doublons sur plusieurs colonnes. Un doublon est avéré lorsque la colonne "Année" (B), "Personne" (D), "Fonction" (H), RIC (L).

Pour résumer, pouvez-vous m'aider à supprimer les doublons lorsque les 4 colonnes ci-dessus sont identiques et ne garder uniquement la ligne la plus ancienne (colonne A) ?

Je vous joint un fichier exemple : dans ce fichier j'ai des doublons avec "Amazon" (colonne B, D, H et L identiques mais je souhaite ne garder que la ligne avec la date la plus ancienne (colonne A).

Je vous remercie par avance,

Bien cordialement,

Loïc DUBOIS

voici une proposition manuelle

Bonjour à tous,

Pouvez-vous, dans votre profil, spécifier la nature de votre produit Excel ? (La langue importe peu, à la différence de votre "version" Excel)

Bonjour,

La version est excel 2019. Merci beaucoup.

Bonjour de nouveau,

Je vous remercie de cette précision (à porter dans votre profil pour la rendre accessible en permanence )

Je vous livre en retour une contribution via Power Query (nativement intégré à votre version Excel) :

Merci beaucoup, pour le temps que vous m'accordez.

Cela à l'air de très bien fonctionner.
En revanche, pouvez-vous m'expliquer comment cela fonctionne car lorsque j'ouvre le fichier je vois que le fichier est maintenant un tableau "bleu" et que le résultat est un tableau "vert" mais comment puis-je appliquer votre solution sur tout un fichier avec 21k lignes dont 10k sociétés distinctes ?

Merci d'avance.

Loïc

Bonjour de nouveau,

....... lorsque j'ouvre le fichier je vois que le fichier est maintenant un tableau "bleu" et que le résultat est un tableau "vert" mais comment puis-je appliquer votre solution sur tout un fichier avec 21k lignes dont 10k sociétés distinctes ?

Le tableau "bleu" correspond à votre Feuil1 qui a été transformée en tableau structuré (nommé t_Data). C'est ce tableau structuré qui a été chargé dans Power Query.

Pour accéder à l'éditeur Power Query, faire un clic droit dans le tableau"vert", puis "Table / Modifier la requête". La fenêtre ouverte, les différentes étapes (traitement effectué par Power Query) figurent sur la partie droite (détail du code dans la barre de formule).

Si votre fichier de travail est de même structure que votre fichier exemple, un simple copier/coller de vos données dans le tableau structuré t_Data suivi d'un "Données /Actualiser tout" devrait vous retourner le résultat attendu. Votre volumétrie n'est pas un souci.

Merci pour votre réponse,

En revanche, le "modifié la requête" est grisé. (ci-joint capture d'écran)

image

Bonjour de nouveau,

C'est étrange......

Autre manière d'accéder à Power Query : Menu "Données / Requêtes et connexions" puis clic droit et Modifier sur la requête figurant dans la fenêtre de droite.

Bonjour

Bonjour à tous

Une variante

Bye !

Bonsoir,,
Pour information, multiposte !...
Vous êtes 6 sur le sujet.
Cdlt.

Bonsoir à tous,

Pour information, multiposte !...
Vous êtes 6 sur le sujet.

6 !

Et de surcroît notre ami pousse l'indélicatesse jusqu'à faire un copier/coller des réponses aux différentes contributions... Du grand art....

@Jean-Eric : Merci de votre vigilance.

Rechercher des sujets similaires à "supprimer doublons colonnes garder date ancienne"