Regroupement statistique (profilage de données)

Bonjour,

J'ai un fichier qui contient les résultats d'une population à deux tests (A et B) que chaque individu a passé.

Chacun de ces tests est constitué de 2 épreuves (Epreuve 1 et Epreuve 2).

A noter que l'épreuve 1 est soit une réussite soit un échec, alors que l'épreuve 2 permet une troisième issue intermédiaire : le rattrapage.

Le fichier est attaché à ce post.

Le fichier contient 1755 résultats aux épreuves 1 et 2 du test A + 1755 résultats aux épreuves 1 et 2 du test B.

Je souhaiterais établir des profils selon les résultats aux épreuves 1 et 2 pour chaque test afin de pouvoir ensuite étudier chacun de ces profils (pour quoi tel groupe réussit souvent, pourquoi tel groupe échoue souvent, etc...).

J'aimerais obtenir le moins de groupe possible à étudier (disons entre 3 et 8 groupes pour chacun des 2 tests A et B), mais tout en conservant des profils homogènes et cohérents au sein de chaque groupe.

Je ne sais pas comment procéder...

Merci de vos conseils. N'hésitez pas à me poster un exemple à partir du fichier joint à ce post.

Nicole

34resultats.xlsx (244.99 Ko)

bonjour

où sont les groupes ?

Bonjour,

Les groupes sont à créer justement.

Pour chaque test A et B séparément, le but est de regrouper les lignes dans des groupes qui rassembleront des lignes dont les résultats aux épreuves 1 et 2 sont proches.


autrement dit, ma question est : y a-t-il un outil ou une méthode pour créer des groupes (profils) au regard des résultats aux épreuves 1 et 2 (5 colonnes).

Personne ne sait comment grouper ces données par profil statistique?

Rechercher des sujets similaires à "regroupement statistique profilage donnees"