Bonjour à tous,
voici mon problème: dans le fichier ci-joint,
https://www.excel-pratique.com/~files/doc/3csc7Exemple.xls
que j'ai volontairement raccourci puisqu'il contient normalement 60000 lignes, je voudrais pouvoir créer une colonne supplémentaire dans laquelle soit affiché le nombre de fois où le même terme est répété dans la colonne miRNA. Exemple: dans la nouvelle colonne, il faudrait trouver le nombre de fois où le terme hsa-let-7a est répété dans la colonne miRNA, ainsi que le nombre de hsa-let-7b, hsa-let-7c, etc...
si vous pouvez répondre à cela je gagnerais déjà un temps considérable! c'est mon problème le plus important.
une deuxième question: soit le groupe de gènes "hsa-let-7a genes" la liste de gènes de la colonne Gene symbol pour laquelle le terme de la colonne miRNA est hsa-let-7a. dans ce groupe "hsa-let-7a genes" il y a des répétitions d'un même terme dans la colonne Gene symbol (AP1S1, ARID1A,...), je voudrais pouvoir éliminer ces redondances et obtenir le nombre de gènes (colonne Gene symbol) différents correspondants à chaque terme de la colonne miRNA (hsa-let-7a, hsa-let-7b...) sans ces redondances.
n'hésitez pas à me contacter si je n'ai pas été suffisamment clair dans l'exposé de mon problème.
Merci pour votre attention. Je vous serais très reconnaissant si quelqu'un pouvait m'aider!
Grég