Analyse d'association des mots
Bonjour à tous,
Je reviens ici car ce forum m'a toujours bien aidé à trouver des solutions.
J'ai un fichier de données à faire sur excel et je ne sais pas comment l'analyser. C'est un peu une question de "logique statistique".
Il s'agissait d'une tâche ou les participants devaient regrouper ensemble des mots. Ils avaient plusieurs mots écrits sur des papiers et ils devaient créer des catégories. Il peut y avoir autant de catégories qu'ils veulent et le type de catégories qu'ils souhaitent. C'est une petite étude pour voir quels mots sont associés ensembles.
Ci-joint le fichier avec un seul participant d'inscrit. Il y a les numéros de sujet et les mots. Les chiffres sous les mots correspondent à des catégories. C'est a dire que lors du recueil des données, on attribuait de manière arbitraire un numéro au "pile" de mots fait pas les participants. Par exemple si un participant a mit les mots "régimes" "poids" et "gros" ensemble, ils sont noté avec le chiffre 4. Tous les mots de ce participant avec le chiffre 4 ont donc été mis ensemble. Ce n'est peut-être pas la meilleure manière de présenter les résultats d'ailleurs...
Je voudrais analyser les données pour savoir quelle "catégorie" sont créer et de quels mots sont-elles composées ? Quels mots sont les plus souvent ensemble.
J'ai cherché du côté des tableaux de co-occurence. Mais avec ça, les mots ne sont associés que deux par deux et non dans des grands ensembles. J'ai aussi regarder par les analyses factorielles ou les analyses de composantes multiples que je connais pas mais ce n'est pas la distribution des participants qui m'intéressent mais plutôt des mots.
Auriez vous une piste à me proposer ?
Un grand merci
Bonsoir,
Je voudrais analyser les données pour savoir quelle "catégorie" sont créer et de quels mots sont-elles composées ? Quels mots sont les plus souvent ensemble.
Cela peut se faire, si comme il semble la liste de mots est prédéfinie.
Il faudrait un échantillon un peu plus complet pour amorcer une étude...
Cordialement.
Bonjour
Oui merci, je voulais trouver la solution pour l'analyse avant de commencer les tests. mais j'aurai les données le 21 mars. J'attends ce moment pour revenir vers vous où je peux essayer l'analyse en attendant les données ?
Oui la liste de mots est prédéfinie
Merci beaucoup
On ne peux appliquer une méthode, en tester des variantes ou des options qu'à partir d'un échantillon de données. C'est à partir de résultats sur cet échantillon que l'on peut voir la façon d'atteindre le mieux les résultats que l'on souhaite obtenir.
L'idée de base qui m'est venu est de voir pour chaque mot les mot qui lui sont associés par chaque sujet : à partir d'un mot on a tous les ensembles auquel il participe et leur extension en nombre de sujets. En faisant cette opération sur chaque mot, on obtiendra une série d'ensemble dont il faudra éliminer les doublons et qui peuvent être classés.
Ensuite il faudra voir si l'on en tire assez d'informations ou non, comment en obtenir plus ou d'autres. A ce stade je n'ai pas encore d'idée, tant que l'on n'a pas pu faire un premier recensement exhaustif d'associations...
Cordialement.
Bonjour
Voici donc mes résultats.
Les numéros de participants puis les mots. Les numéros sous les mots ne correspondent à rien vraiment mais les mots avec les mêmes numéros dans une même ligne (par participant) ont été mis ensemble par le participant.
Je voudrais donc savoir quels mots ont le plus souvent été mis ensemble et si certains appartiennent plus à une "catégorie de mot" que d'autres.
Un grand merci de votre aide !
Bonjour,
Vu ton retour, mais pas eu le temps de m'en occuper... Vais essayer durant week-end.
Bonne journée.
Avec un peu de décalage, j'ai entrepris une procédure destinée à enregistrer et lister les associations...
Avant de poursuivre par l'élimination des doublons (avec comptage...) j'ai voulu lister sur feuille pour mieux voir la situation...
Là je me suis heurté à une erreur provoquée par une variable Integer qui ayant atteint la valeur 32767 refusait naturellement de s'incrémenter de 1 !
S'agissant d'une variable dont la valeur ne peut dépasser le nombre de personnes ayant participé à l'opération, c'est une dérive imprévue...
Mais au réveil, les conditions requises pour chercher ne sont pas vraiment réunies, j'y reviendrai donc plus tard...
A titre d'information... !