Retrouver les associations les plus fréquentes

Bonjour, j'ai un problème qui me semble insurmontable dans Excel, et je suppose que mon tableau est mal construit pour y répondre, j'ai besoin de votre aide.

Je travaille en biologie. Nous recherchons la présence de virus chez des patients, avec un testing large. Les patients (une ligne par patient dans mon tableau) peuvent porter entre 1 et 7 virus parmi 16 différents qui existent.

Mon tableau présente 7 colonnes (Virus n°1, virus n°2, virus n°3 ... jusqu’à virus n°7, par ordre de découverte) et un patient par ligne. A chaque ligne, je marque l'identifiant du virus retrouvé (ADV, BOV, etc ...) dans la colonne correspondante à l'ordre de découverte.

Les deux tiers de mes patients sont infectés à plus d'un virus, les virus sont donc associés entre eux.

Mon patron me demande quels sont les associations les plus fréquentes. Je tente le tableau croisé dynamique, qui ne marche que pour des associations de 2 virus, aprés cela devient difficilement lisible, ou alors je n'arrive pas à le mettre bien en forme.

EN gros, je voudrais avoir une liste me disant : ADV est associé à BOV dans 18 cas sur mes 35 patients ... ou encore l'association ADV+BOV+PI est présente dans 3 cas sur les 85, etc ... Et si possible les trier par fréquence d'association.

J'ai mon fichier excel anonymisé à dispo si vous avez une idée. Là, je sèche :/ j'image que mon tableau est mal conçu pour répondre à ma question. C'est un peu comme si j'avais des objets à 7 variables, et que je voulais savoir quelques étaient les variables les plus souvent ensemble sur mes différents objets.

Point de détail : l'ordre de sortie n'a aucune importance pour le portage de virus : ADV + BOV est la même chose que BOV + ADV ...

Une idée ?

bonjour,

Oui, Oui on souhaite le fichier...

A+

12virus.xlsx (10.55 Ko)

Voici le fichier

Merci de votre aide !

Bonjour,

un solution via une macro.

16virus.xlsm (20.08 Ko)

Merci pour la macro, ça m'aide déjà à y voir un peu plus clair.

Cependant, ce n'est pas tout à fait le résultat dont j'ai besoin. Il me faudrait plus quelque chose qui dise : ADV est associé à VRS chez 9 patients, qu'il soit associé à d'autres virus encore ou juste ADV+VRS. La macro que tu me proposes distingue ADV+VRS+BOV de ADV+VRS.

En fait, il faudrait que cela rende un tableau à double entrée, la liste des germes en colonnes et en ligne et dans chaque case le nombre de cas dans lesquels ils sont associés

ADV BOV VRS

ADV - 3 4

BOV 5 - 4

VRS 2 3 -

[EDIT] : La mise en forme est pas terrible, m'enfin, vous voyez l'idée ?

Quelque chose comme ça, mais je n'ai pas réussi à le faire avec un TCD ... Croyez vous cela possible ??

Merci de votre aide !!

Bonjour,

2 boites de Doliprane plus loin....

Voilci le résultat de ma réflexion !

Cette étude ne recense que les groupes tels qu'ils existent réellement

Il pourrait être interressant de compter les couples quand on les retrouvent également dans des groupes de 3, de 4...

Ce sera l'objet de la prochaine version.

A+

7virus-vg3.xlsm (52.91 Ko)

Bonsoir,

Proposition en PJ.

Cordialement.

PS : Sélectionner la plage T2:AI16, saisir la formule dans la cellule T2 puis Ctrl+Entrée pour répéter dans toutes les cellules de la sélection.

13virus.xlsx (15.60 Ko)

Bonsoir,

une approche qui compte toutes les occurrences des différentes combinaisons (1-2-3- .. n) en utilisant un générateur de combinaisons.

11virus.xlsm (24.50 Ko)

Bonjour,

J'ai édité mon fichier pour corriger un bug (Absence de MN)

Le tableau actuel ne compte que les groupes "en l'état"

Il pourrait être interressant de compter les items à la manière de h2so4 (scratch)

(par exemple tous les couples en rajoutant les occurrences qui figurent dans un groupe de 3, de 4...

ADV-VRS est compté pour 4 mais on le retrouve également dans d'autres groupes.

VRS est compté pour 9 m'ais il ressort bien plus souvent en association...

La prochaine version recensera ces possibilités.

En fait à partir de cette étude, on peut étudier tous les cas de figure... Il suffit de savoir ce qu'on désire exactement !

A+

14virus-vg3.xlsm (52.91 Ko)

Un immense MERCI à tous pour m'avoir aidé à trouver ma solution et, plus important, m'avoir montré des exemples de réflexions et de systèmes pour résoudre ce problème tous plus ingénieux les uns que les autres. J'ai vraiment appris des choses, là !

Merci à tous !!

Rechercher des sujets similaires à "retrouver associations frequentes"