Bonjour,
Un fichier est extrait d'un site avec les souhaits des salariés. J'ai pour mission de regrouper les souhaits des salariés en mots-clés. Exemple si Salarié A souhaite être formé en Anglais, le Salarié B souhaite être formé en anglais & Salarié C en EnGlais , j'aimerai qu'ils appartiennent tous à la même sous-classe (ici Anglais ou langue je ne sais pas trop encore). Tout en sachant que les souhaits sont aléatoires et imprévisibles càd je ne peux pas vraiment deviner ce qu'ils vont mettre à l'avance. même si j'ai accès à un catalogue avec thème/sous-thèmes des formations etc.
Je ne sais pas si j'ai été assez claire. Mais avez-vous une solution pour essayer de regrouper au max les données? Bien entendu ce n'est pas grave si certaines ne rentrent pas dans les sous-thèmes.
J'ai entendu parlé de la distance du hamming qui est généralement codée en Python et que je ne saurais coder en VBA, je pense qu'elle me serait utile pour nettoyer les données et après il manquerait qu'à les regrouper en mot-clé.
Merci d'avance.