Comptage et élimination de redondances

Bonjour à tous,

voici mon problème: dans le fichier ci-joint,

https://www.excel-pratique.com/~files/doc/3csc7Exemple.xls

que j'ai volontairement raccourci puisqu'il contient normalement 60000 lignes, je voudrais pouvoir créer une colonne supplémentaire dans laquelle soit affiché le nombre de fois où le même terme est répété dans la colonne miRNA. Exemple: dans la nouvelle colonne, il faudrait trouver le nombre de fois où le terme hsa-let-7a est répété dans la colonne miRNA, ainsi que le nombre de hsa-let-7b, hsa-let-7c, etc...

si vous pouvez répondre à cela je gagnerais déjà un temps considérable! c'est mon problème le plus important.

une deuxième question: soit le groupe de gènes "hsa-let-7a genes" la liste de gènes de la colonne Gene symbol pour laquelle le terme de la colonne miRNA est hsa-let-7a. dans ce groupe "hsa-let-7a genes" il y a des répétitions d'un même terme dans la colonne Gene symbol (AP1S1, ARID1A,...), je voudrais pouvoir éliminer ces redondances et obtenir le nombre de gènes (colonne Gene symbol) différents correspondants à chaque terme de la colonne miRNA (hsa-let-7a, hsa-let-7b...) sans ces redondances.

n'hésitez pas à me contacter si je n'ai pas été suffisamment clair dans l'exposé de mon problème.

Merci pour votre attention. Je vous serais très reconnaissant si quelqu'un pouvait m'aider!

Grég

Bonjour

Pour ton 1er point :

Fichier

Pour le second, j'ai lu et relu mais je ne comprends pas ta demande. Merci de préciser.

Amicalement

Nad

Re

Pour le second point, si j'ai compris :

Fichier

Amicalement

Nad

Salut Nad,

merci beaucoup, le premier fichier marche parfaitement, il faudra seulement que tu m'expliques comment je peux généraliser cet automatisme à tout le fichier. c'est à dire que dans le fichier normal il y a plusieurs centaines de termes miRNA différents, suffit-il de copier ta formule dans toute la colonne pour que tous les termes s'affichent automatiquement?

je n'ai malheureusement pas le temps de tout vérifier aujourd'hui, mais il faudra que je te reprécise la deuxième partie de ma question demain.

Merci beaucoup, ça me simplifie déjà beaucoup la tâche

A bientôt

Grég

Re

Tu entres la formule dans la 1ère cellule et tu la tires vers le bas. Pour être sûr d'être allé suffisamment bas, tu vas jusqu'à la dernière ligne de ta colonne B (les cases seront vides si la réponse à la formule est fausse).

Ne pas oublier d'insérer une ligne vide au dessus de la ligne de titre.

Pour le point 2, j'attends donc tes explications supplémentaires.

A te relire

Amicalement

Nad

Salut Nad,

désolé, j'ai eu pas mal à faire. j'ai eu le temps d'utiliser plusieurs fois tes formules et elles fonctionnent très bien, même si l'opération sur des fichiers volumineux a fait crasher une ou deux fois mon PC!

voici les commentaires pour le deuxième point de mon problème. dans le deuxième fichier que tu m'as envoyé, la colonne nbre gene symbol devrait contenir le nbre de gène pour chaque miRNA après élimination des redondances.

je m'explique: pour le miRNA hsa-let-7a, il y a une liste de 307 gènes comme ta formule l'atteste. Si on élimine les redondances dans cette liste de 307 gènes il en reste 174. de même pour hsa-let-7b, on passe de 303 à 171 sans redondances. est-il possible d'automatiser cet élimination de redondances?

merci encore!

Salutations

Grég

Bonjour

Grâce à l'application d'une formule de Jean-Marie :

Fichier

Amicalement

Nad

Rechercher des sujets similaires à "comptage elimination redondances"