Formule d'identification de mots récurrents dans une plage donnée

Bonjour à tous, toutes,

Je cherche à trouver une formule permettant d'extraire d'une plage de données les 10 mots les plus récurrents --> une sorte de mode mais pour du texte

Je m'explique :

Dans la plage de cellules C2:C950, il y a du texte dans chaque cellule.

J'aimerai une formule qui identifie dans cette plage quels mots reviennent souvent (plus de 3 fois par exemple).

Afin d'éviter tous les mots de liaisons et mots "courants"; on peut partir sur le fait qu'un mot recherché fait plus de 3 lettres et est séparé des autres mots par un espace.

Est-ce que quelqu'un a connaissance d'une telle formule ou a des pistes que je pourrai suivre pour la faire ?

Pour re-contextualiser, disons que des clients me contactent par message et que chacun de leur message se trouve dans cette plage de cellules (il y a + de 900 cellules donc + de 900 messages) --> je souhaite déterminer quel sujet (mot) reviens souvent (sans le connaitre à l'avance donc) afin de pouvoir extraire les messages par sujet récurrent (par mot récurrent) par la suite et ainsi leur répondre plus rapidement.

J'espère avoir été assez claire dans ma demande !

Je vous remercie par avance pour toute l'aide que vous pourrez m'apporter

Allie

Bonsoir,

je n'ai pas (encore ?) la solution, mais je prendrais le problème dans l'autre sens si c'est possible :

Prendre une liste de thème connu pour lesquels vous pourrez répondre "précisément" et je chercherais les messages qui parle de ces thèmes.

Les messages qui ne sortiraient aucun thème seraient alors visibles comme étant classés dans "Autre".

@ bientôt

LouReeD

Rechercher des sujets similaires à "formule identification mots recurrents plage donnee"