Bonjour,
A partir d’un tableau de données assez conséquent, je souhaite pouvoir connaitre le nombre de personnes remplissant certains critères.
Une personne (identifiée par son Nom et son ID), est acceptée dans un groupe par le biais d’un parrain. Elle obtient alors un ticket d’entrée avec un numéro, et possède une date d’entrée dans ce groupe. En le quittant, elle obtient une date de départ.
Sur une ligne on retrouve donc le nom de la personne, son appartenance à un groupe, son ID, le numéro du ticket d’entrée dans un groupe, la date d’adhésion au groupe et enfin la date de départ de ce même groupe :
Groupe 1 | Numéro ticket 1 | Pierre Paul Jacques | Parrain | ID | Date adhésion |Date départ
Groupe 2 | Numéro ticket 2 | Pierre Paul Jacques | Parrain | ID | Date adhésion | Date départ
[ ……. ]
Problème : le nom d’une personne apparait plusieurs fois dans le tableau car elles peuvent avoir appartenu aux 2 groupes, avoir intégré le premier groupe 2 fois (en entrant donc dans ce groupe une deuxième fois avant de le quitter à nouveau), ce qui ajoutera encore plus de lignes, tel que :
Groupe 1 | Numéro ticket 1 | Pierre Paul Jacques | Parrain | ID | Date adhésion |Date départ
Groupe 1 | Numéro ticket 2 | Pierre Paul Jacques | Parrain | ID | Date adhésion |Date départ
Groupe 2 | Numéro ticket 3 | Pierre Paul Jacques | Parrain | ID | Date adhésion | Date départ
[ ……. ]
Cependant, même si une personne quitte le 2eme groupe (et donc possède une date de départ pour le groupe 2), elle ne pourra pas le réintégrer. Il y aura donc au maximum 3 lignes concernant une même personne.
Mon souhait est de connaitre les personnes ayant quitté le groupe 1 pour le groupe 2 (aucune importance si la personne soit entrée une ou deux fois dans le groupe 1) tout en remplissant ces critères :
- Que la différence entre la date de départ du groupe 1 (si la personne y est entrée 2 fois alors on prend la deuxième date de départ du groupe 1, la plus récente) et la date d’adhésion au groupe 2 soit d’au maximum un an
- Que le parrain pour le groupe 1 et 2 soit le même (si le parrain de la personne pour le groupe 1 n’est pas le même pour le groupe 2 cela ne compte pas)
- Connaitre ce nombre par parrain
Étant donné qu’il faut comparer plusieurs lignes car les informations nécessaires pour une seule personne ne se trouvant pas sur une même ligne, je peine énormément à trouver comment gérer ce problème de manière rapide et efficace.
J’ai dans un premier temps listé à la main les personne remplissant ces critères en coloriant les lignes, puis en triant avec la formule « =SI(couleurcellule(n°cellule)>0;"Oui";"Non") », pour enfin créer un TCD à partir de ce tableau filtré et connaitre ce nombre de personne par parrain, mais la tâche est fastidieuse et je n’ai aucune idée de comment procéder de manière optimisée pour un jeu de données possédant des milliers de lignes ..
Des idées svp ?