Supprimer doublons et ligne entière via formule

Bonjour à toutes et tous,

Dans le cadre d'une mission d'entreprise, je suis en charge de trouver la solution a un problème de doublons que nous n'arrivons pas à résoudre. Pour expliquer simplement, nous avons notre CRM avec des fiches entreprises et contacts et nous avons notre outil de prospection. Nous importons des données de l'outil de prospection vers notre CRM via un fichier XLS, CSV ou autre. Mais aucun de nos outils gère les doublons et c'est problématique pour nous.

Ce que je pensais faire mais ce n'est qu'une idée, ce serait d'avoir un Google Sheets avec l'ensemble des URL de toutes les fiches entreprises de notre CRM, puisque notre clé d'identification est l'URL du site web du prospect. Ce serait la feuille 1. La feuille 2 correspondrait au fichier que nous voulons mettre sur notre CRM mais que nous devons dédoublonner avant.

En feuille 3 il y aurait le fichier traité par une ou plusieurs formules, dédoublonné et prêt à être importé dans notre CRM.

Je voudrais identifier toutes les URL qui existent en double pour pouvoir supprimer la LIGNE ENTIERE. Donc si j'ai URL de prospect A qui existe dans ma feuille 1 et 2, je veux que TOUTE la ligne de prospect A soit supprimé et n'apparaisse pas dans ma feuille 3.

Si ce n'est pas possible au moins identifier via code couleurs ou autre les URL en double dans feuille 2 et je supprimerai à la main les lignes qu'il faut.

Si vous avez une idée de processus ou de formules je suis preneur car je ne sais pas comment mettre en place ce besoin de dédoublonnage.

Merci à vous d'avance pour votre aide

Bonjour,

Je pense qu'il suffit d'utiliser la fonction UNIQUE sur la colonne avec les URL...

Cordialement,

Fil.

Bonjour Fil, merci de votre réponse.

Le problème étant qu'en effectuant une fonction unique, je supprimerais la case de l'URL doublonné, et non pas sa ligne. Dites moi si j'ai tort mais il me semble que c'est le fonctionnement de la formule

Si tu as une feuille avec des doublons, tu fais une extraction de la feuille avec QUERY(UNIQUE) et tes lignes de doublons sont automatiquement ignorées...

Ok je vois, donc la fonction se base sur les colonnes URL mais est effective sur la ligne entière lors de l'extraction ?

Exactement..

je vous remercie pour ce retour.

Si je peux me permettre de vous demander encore un conseil, savez vous si on peut faire une recherche sur une "similitude" du lien ? C'est à dire je peux avoir une ligne www. abcd . fr et je peux avoir abcd . fr, pour nous c'est un doublon puisque nom d'entreprise similaire. Savez vous si on peut identifier ces doublons ?

Ce n'est pas mon domaine de compétences, mais avec des opérateurs comme LIKE, CONTAINS, MATCHES...

Pour supprimer les doublons facilement, Tu peux également passer par Données, Nettoyages des données, Supprimer les doublons...

Cordialement,

Fil.

Pour un tableau A1:D, ça te renvoie un tableau identique sans lignes en double:

=unique(query(A1:D;"select * "))

Rechercher des sujets similaires à "supprimer doublons ligne entiere via formule"