Suppression des doublons

Bonsoir,

Je suis sous Excel 2007.

Je voudrais connaitre les doublons supprimés

La fonctionalité standard "supprimer les doublons" de l'onglet données donne le nombre de doublons supprimés mais je n'ai pas trouvé la solution pour "voir" ces doublons.

Et comme je n'ai pas vu de fonctionalté "supprimer les non-doublons"...

Merci par avance de votre aide

Bonjour haltero le forum

tu nous mets un petit fichier te je te renvoie la solution

a+

Papou

Bonsoir,

J'ai créé un fichier Excel de test très simple.

Attention les fichiers rééls sur lequels je travaille ont plusieurs dizaines de milliers de lignes.

C'est pour dire que la mise en couleur des lignes en double par exemple ne m'intéresse que très peu car je dois balayer des fichiers très importants en volume

Cordialement

Serge

re bonsoir haltero le forum

bon alors un exemple en fichier joint tu parles de 1000 lignes et plus c'est sans soucis mais déjà est-ce que l'exemple joint correspond ou pas mon exemple et avec une colonne mais je modifierai si cela te convient

a+

Papou

108haltero-v2.zip (12.54 Ko)

Re bonsoir Haltero le forum

voilà avec tes deux colonnes a+

Papou

160haltero-v3.zip (12.70 Ko)

Re,

L'example que tu m'as fourni est une réponse à ma question effectivement.

Mais actuellement je travaille sur un fichier de 70000 lignes avec 3000 doublons (chiffre donné par la fonctionnalité "supprimer les doublons") et si je dois balayer tout le fichier pour trouver ces 3000 doublons, c'est faisable mais l'idéal serait que les doublons soient extraits et mis dans un autre tableau Excel par exemple.

IL faut également que tu saches que ce fichier évolue régulièrement (tous les jours) et s'il y a de nouveaux doublons il faut que je refasse la manip à chaque fois.

J'espère que tu comprends mieux mon problème lié au volume du fichier maintenant

Mais je suis déjà preneur de la solution que tu mets en example dans ton message précédent.

Je viens de voir ton example alors que je rédigeais ce message.

Il faut que je puisse voir les doublons supprimés en sélectionnant toutes les colonnes du tableau et ensuite après avoir supprimer ces doublons, je voudrais voir les doublons dans certaines colonnes (ce que donne ton exemple)

Merci encore

Bonsoir haltero le forum

bon si tu l'avais dit au début que tu voulais extraire la liste des doublons , je l'aurais fait, là plus le temps je vais dormir, je te ferai cela demain

avec recopie des doublons sur la feuille 2 et suppression dans la feuille 1

par contre ton fichier possède combien de colonnes??

un extrait du vrai fichier serait le bienvenu pour voir comment il est fichu

a+

Papou

Bonjour,

J'ai créé un extrait du fichier réel avec quelques doublons.

L'idéal donc serait de récupérer les doublons à supprimer dans un autre tableau Excel.

Merci pour ton aide.

Serge

Bonsoir,

C'est quoi un doublon, pour toi ?

doublons sur quelle ou quelles colonnes ?

Il n'y a pas d'en-têtes ?

à te relire

Claude

Bonsoir,

Il n'y a pas d'entête dans ce fichier.

Mais je peux le rajouter si cela t'est utile.

col A: nom époux

col B: prénom(s) enfant

col C D E: jour mois année naissance enfant

col F: prénom(s) époux

col G: nom et prénom(s) épouse

col H: identifiant du chercheur

col I: informations diverses

C'est un extrait d'un fichier de généalogie.

Je procède en 2 phases:

1) recherche doublons sur toute la feuille.

2) recherche doublons sur une ou plusieurs colonnes

Et dans les 2 cas je souhaiterais connaitre les doublons en les extrayant dans un autre fichier Excel (ou dans un nouvel onglet du même fichier) avant de les supprimer.

Merci

Serge

re,

J'ai créé un extrait du fichier réel avec quelques doublons.

pourrais-tu colorer les lignes de ces quelques doublons, que l'on puisse se faire une idée

Les en-têtes sont indispensables

à te relire

Claude

Bonsoir,

Le lien vers un fichier où il y a 3 doublons ce qui n'était pas le cas du fichier que je t' avais fourni avant.

Je te prie de m'en excuser

Merci

Serge

Bonjour Serge Claude le forum

bon alors Serge, Claude demandait que veux tu comparer? pas les explications de ce que contienne tes colonnes.

d'après ce que tu as mis en rouge, je pense que tu veux comparer toutes les colonnes ligne par ligne

alors là solution va arriver

a+

Papou

Bonjour Haltero le forum

bon voilà ton fichier en retour, le fichier n'a pas besoin d'être classé.

contrôle sur TOUTES les colonnes.

a+

Papou

42haltero-v3.xlsm (32.83 Ko)

Bonjour à tous,

Solution filtre,

j'ai ajouté une colonne A (N° Ligne), pour pouvoir la retrouver en vue de suppression,

On est pas obligé de trier le tableau, ici j'ai déplacer un "BODIN" en ligne 20

à noter que ici, on contrôle toutes les colonnes,

mais on pourrait en contrôler que quelques unes.

Amicalement

Claude

Bonjour à tous,

Vous êtes super car cela va me permettre de faire le ménage dans nos tableaux.

La procédure "Haltero v3" marche impeccable et d'ailleurs je l'ai testé sur deux autres tableaux qui n'ont pas la même structure mais en insérant une ligne en première position et en mettant un "#" dans la cellule A1, cela marche impeccable.

Je l'ai testé ensuite sur un de nos plus gros tableau (celui de 70000 lignes), cela mouline un certain temps (15 minutes environ) mais résultat nickel.

J'ai vu que Claude a crée une autre procédure (on dit macro ?), cela marche sur l'extrait que je vous ait fourni.

J'efface les lignes en doublons dans la feuille "extrait" et je peux reproduire la procédure à chaque fois.

C'est encore mieux pour moi car j'ai le n° de ligne en doublon.

Mais je n'ai pas réussi à le reproduire sur le fichier complet.

J'ai ajouté en colonne A une numérotation de 2 à n

J'ai inséré en première ligne de la feuil1 les identifiants des colonnes (n° ligne, nom époux, etc...)

J'ai essayé en insérant ces mêmes identifiants dans l'onglet 2 (Feuil2)

Mais j'ai une erreur.

Les 2ème et 3ème "Range" (Range ("a1:k" ....) et Range ("m1:m2" ...) sont en jaune avec une flèche pointant sur le Range ("m1/m2"...)

avec le message "erreur d'exécution "9": L'indice n'appartient pas à la sélection"

J'ai d'autres ajouts à vous demander (celà rejoint la remarque de Claude sur le fait de rechercher les doublons en sélectionnant cetaines colonnes seulement) mais je pense qu'il faut peut-être attendre de résoudre le l'erreur que j'ai avant d'aller plus loin

Un grand merci car franchement vous êtes sympa, rapide et efficace

Amicalement

Serge

Bonsoir Haltero le forum

pas de problème si tu veux un numéro de ligne je peux te le faire aussi

enfin tu me rediras

a+

Papou

Bonsoir Papou,

Mettre les N° de ligne est un plus de confort (appréciable)

J'ai essayé ta procédure sur un tableau ayant plus de 10 colonnes et cela n'a pas marché.

L'idéal serait qu'on me de mande (ou qu'un variable en début de procédure soit mise) le nb de colonnes (ou la lettre de la dernière colonne) sur lesquels rechercher les doublons.

Je recherche également des doublons mais en utilisant certaines colonnes seulement.

Il faudrait me demander les colonnes à utiliser pour chercher les doublons ou mettre une variable en début de procédure où je mettrais les lettres des colonnes par exemple..

Merci

Serge

Bonsoir à tous,

J'ai essayé en insérant ces mêmes identifiants dans l'onglet 2 (Feuil2)

la macro ne connait pas "Feuil2",

soit tu nomme la feuille "Extrait" comme j'avais fait,

soit tu change dans la macro "Extrait" en "Feuil2"

    Range("a1:k" & Lg).AdvancedFilter Action:=xlFilterCopy, CriteriaRange:= _
    Range("m1:m2"), CopyToRange:=Sheets("Extrait").Range("a1:j1"), Unique:=False

à mon avis, il vaut mieux renommer la feuille "Extrait"

Pour le temps de traitement, je pense que ma solution (filtre) serait plus rapide

édit: bien sûr, il faut la structure réelle du fichier pour mettre au point la macro

Amicalement

Claude

Bonsoir Claude,

Je suis vraiment idiot.

La procédure de Papou utilisant le nom d'onglet "Doublons" je suis resté sur ce nom....

Ta procédure marche impeccable.

C'est beaucoup plus rapide que celle de Papou mais là n'était pas mon Pb principal (quoique pour tester c'est quand même intéressant).

As-tu vu le message que j'ai envoyé à Papou sur la sélection par colonnes (que tu as évoqué dans un message précédent) sachant que Papou travaille peut-être sur le sujet.

Petite question de béotien: pour numéroter de 1 à n la colonne A je mets 1 en A1,2 en A2 et puis ensuite j'étire jusque la n-ième ligne en utilisant la croix en bas à droite de la cellule A2.

Y-a-t-il une manière de faire plus rapide de faire (c'est un détail mais quand il y a plusieurs dizaines de milliers de lignes....)

Merci encore

Amicalement

Serge

Rechercher des sujets similaires à "suppression doublons"