Déterminer valeur de référence à partir de recueil de données

Bonjour à tous,

je ne sais pas si je suis au bon endroit pour poser ma question, mais je me lance:

j'ai recueilli plusieurs données sur le terrain (mesure de contamination à différents endroits) et j'aurais aimé définir une valeur de référence pour chaque endroit.

Je ne sais pas quel outil statistique utilisé (moyenne, écrat-type,...)

Pouvez-vous éclairer ma lanterne?

Merci

Bonjour,

Du coup, une question me vient. Quel est l'intérêt d'aller récupérer des données sur le terrain si l'on ne sait pas quoi en faire ?

Dans tous les cas, sans voir ton fichier, c'est dur de te répondre...

Bonjour, salut Noël !

Je rejoins la remarque, sans plus d'illustration de la problématique et des données à disposition, je ne vois pas comment on pourrait apporter une quelconque aide...

Bonjour à tous les 2,

les données sur le terrain sont prélévées pour suivre l'efficacité du nettoyage.

Comme vous vous en doutez il y a des variations de ces mesures.

L'idée, c'est avec des outils statistiques, de déterminer une valeur de référence et aussi de créer une échelle de vigilance (insatisfaisant/à surveiller/correct).

L'idée c'est de déterminer une valeur de référence pour chaque étape et pour chaque surface (zone de prélèvement). Aussi j'aimerais créer une échelle de surveillance.

9classeur1.xlsx (15.27 Ko)

Hello Pedro !

Bien content que tu sois passé par-là.

Bon courage

(je ne suis vraiment pas bon en stats)

Une possibilité avec un tableau croisé dynamique (TCD) :

9classeur1.xlsx (23.17 Ko)

Dans le cas présent j'ai affiché la moyenne, néanmoins ce n'est probablement pas un indicateur satisfaisant compte tenu de la forte variabilité des relevés.

Par exemple, si l'on regarde la dispersion des mesures à l'étape 1, toutes zones confondues :

dispersionetape1

La moyenne est de 444 000, mais en réalité il y a peu de valeurs proches de cette moyenne, on a surtout des extrêmes. Je vous recommande donc plutôt de travailler sur des quartiles ou centiles pour déterminer des seuils (insatisfaisant/à surveiller/correct). Il existe aussi des méthodes de classification statistiques pour établir ces seuils qui délimitent des groupes : par exemple la CAH, les k-means, etc... Mais c'est certainement plus complexe à réaliser, restez de préférence sur des outils que vous maitrisez. Il n'y a pas de bonne méthode, vous êtes le plus à même de juger de la pertinence de telle ou telle méthode.

Bonjour,

merci pour ce début de travail.

En ce qui concerne les quartiles et les déciles, comment se répartissent ces derniers: déciles pour valeurs à surveiller?correct?insatisfaisante?

Vous seul avez la réponse à cette question, au regard des données d'une part et de votre expertise d'autre part.

Il n'y a pas de seuils clairs qui ressortent à priori de vos données. La segmentation sera donc nécessairement un peu arbitraire.

Un exemple pour l'étape 1 :
- insatisfaisant : >700 000
- à surveiller : 60 000 à 700 000
- correct : <60 000

S'il s'agit de contamination à différentes étapes de nettoyage, vous pouvez aussi calculer un % de réduction de la contamination initiale et calculer vos seuils sur cet indicateur.

Merci pour ton aide Pedro22,

Concernant le calcul du % de réduction de la contamination initiale, comment je fais pour définir les seuils sur cet indicateur?

Merci pour ton aide Pedro22,

Concernant le calcul du % de réduction de la contamination initiale, comment je fais pour définir les seuils sur cet indicateur?

De la même manière que ci-dessus, mais j'insiste, vous seul êtes à même de déterminer des seuils cohérents avec votre sujet. De mon côté je ne peux que donner des pistes.

Ok très bien

Encore merci pour tes explications Pedro22!

A bientôt

Ok très bien

Encore merci pour tes explications Pedro22!

A bientôt

Merci de ton retour, et n'hésite pas à donner le fin mot de l'histoire : la méthode et les seuils que tu as choisi !

Pas de soucis j'y penserais!

Rechercher des sujets similaires à "determiner valeur reference partir recueil donnees"