Déterminer valeur de référence à partir de recueil de données

Question

Je ne sais pas si je suis au bon endroit pour poser ma question, mais je me lance: j'ai recueilli plusieurs données sur le terrain (mesure de contamination à différents endroits) et j'aurais aimé définir une valeur de référence pour chaque endroit. Je ne sais pas quel outil statistique utilisé (moyenne, écrat-type,...) Pouvez-vous éclairer ma lanterne? Merci...

Pedro22 · Accepted Answer

Vous seul avez la réponse à cette question, au regard des données d'une part et de votre expertise d'autre part.

Il n'y a pas de seuils clairs qui ressortent à priori de vos données. La segmentation sera donc nécessairement un peu arbitraire.

Un exemple pour l'étape 1 :
- insatisfaisant : >700 000
- à surveiller : 60 000 à 700 000
- correct : <60 000

S'il s'agit de contamination à différentes étapes de nettoyage, vous pouvez aussi calculer un % de réduction de la contamination initiale et calculer vos seuils sur cet indicateur.

21Formatic · Answer

Du coup, une question me vient. Quel est l'intérêt d'aller récupérer des données sur le terrain si l'on ne sait pas quoi en faire ? Dans tous les cas, sans voir ton fichier, c'est dur de te répondre.....

Pedro22 · Answer

Je rejoins la remarque, sans plus d'illustration de la problématique et des données à disposition, je ne vois pas comment on pourrait apporter une quelconque aide.....

21Formatic · Answer

Bien content que tu sois passé par-là. Bon courage (je ne suis vraiment pas bon en stats)...

Pedro22 · Answer

Une possibilité avec un tableau croisé dynamique (TCD) :

10classeur1.xlsx (23.17 Ko)

Dans le cas présent j'ai affiché la moyenne, néanmoins ce n'est probablement pas un indicateur satisfaisant compte tenu de la forte variabilité des relevés.

Par exemple, si l'on regarde la dispersion des mesures à l'étape 1, toutes zones confondues :

La moyenne est de 444 000, mais en réalité il y a peu de valeurs proches de cette moyenne, on a surtout des extrêmes. Je vous recommande donc plutôt de travailler sur des quartiles ou centiles pour déterminer des seuils (insatisfaisant/à surveiller/correct). Il existe aussi des méthodes de classification statistiques pour établir ces seuils qui délimitent des groupes : par exemple la CAH, les k-means, etc... Mais c'est certainement plus complexe à réaliser, restez de préférence sur des outils que vous maitrisez. Il n'y a pas de bonne méthode, vous êtes le plus à même de juger de la pertinence de telle ou telle méthode.

Pedro22 · Answer

De la même manière que ci-dessus, mais j'insiste, vous seul êtes à même de déterminer des seuils cohérents avec votre sujet. De mon côté je ne peux que donner des pistes...

Pedro22 · Answer

Merci de ton retour, et n'hésite pas à donner le fin mot de l'histoire : la méthode et les seuils que tu as choisi ...