Statistiques

Bonjour à tous,

J'ai des séries de données à analyser pour une thèse en médecine, et j'ai une question bien précise à ce sujet.

J'ai 5060 données pour un taux d'acylcarnitine chez des patients sains. Avec cela, je voudrais obtenir un intervalle de confiance de 95% pour ce taux et donc disposer ainsi d'une limite basse, et d'une limite haute.

Comment faire??

Merci d'avance.

Bonjour et bienvenue coppersurfer,

Il est important que tu essaies de "traduire" ça en français compréhensible par le commun des mortels

Si j'essaie de traduire, cela donne :

Si l'intervalle de confiance à 95% est [10% ; 15%] -> on est sûr à 95% qu'entre 10% et 15% de patients sains ont un taux d'acylcarnitine ... ?

Avec cela, je voudrais obtenir un intervalle de confiance de 95% pour ce taux

Mathématiquement, qu'est-ce que cela signifie?

Peux-tu nous joindre un bout de fichier afin d'illustrer ta demande? Ça faciliterait également la recherche d'une solution!

Sinon, il existe une fonction excel INTERVALLE.CONFIANCE qui pourrait peut-être t'aider?

A+

Ben en fait, pour mes 5060 patients sains, j'ai 5060 résultats d'acylcarnitine. Jusque là ca va!!

Ce que j'aimerai avec ces données , c'est pouvoir construire un intervalle qui signifierait que 95% des patients sains ont leur résultat d'acylcarnitine compris entre X (valeur basse de mon intervalle) et Y (valeur haute de mon intervalle).

En fait, concretement, on m'a demandé avec toutes ces valeurs de pouvoir mettre des bornes saines (basse et haute) pour ce taux, et ainsi, si quelqu'un possede un taux supérieur à la borne haute, on pourra se dire "Ah tiens, c'est anormal. Faut regarder ce qu'il y a!!"

Est ce que j'ai été plus clair??

Voici une partie de mes données

https://www.excel-pratique.com/~files/doc2/Tya4UClasseur1.xlsx

Autrement l intervalle de confiance d'excel ne me permet que de realiser un intervalle de 95% pour la moyenne.

Merci.

Re,

Oui c'est plus clair là! Le problème, c'est que d'un point de vue statistique, ton énoncé ne

correspond pas (vraiment?) à la notion d'intervalle de confiance. Enfin, celle que je connais.

En effet, en statistique, l'intervalle de confiance correspond à une proportion et non à un taux (d'acylcarnitine dans ton cas).

Si on pouvait donner une application de l'intervalle de confiance dans ton cas ce serait par

exemple : on est sûr à 95% qu'entre ...% et ...% des patients sont sains.

C'est seulement un exemple, car tous tes patients sont sains.

Je pense donc qu'il y a une autre notion de statistique qu'il faudrait faire intervenir mais je ne sais pas du tout laquelle??!

Bonjour,

Je partirais d'une formule du genre : moyenne - 2 fois l'écart-type pour la valeur mini, et moyenne + 2 fois l'écart-type pour la valeur maxi. Cela suppose que la série respecte la distribution normale.

Voir le schéma sur le lien suivant :

La moyenne et l'écart-type pouvant être calculés très facilement sur Excel.

Cordialement,

Bonsoir V_Elbie,

En fait j'avais pensé à cette solution mais est-on sûr que la série respecte la distribution normale

Car les critères de normalité sont les suivants :

- 68% des patients sains doivent avoir un taux compris entre [moyenne - écart-type ; moyenne + écart-type]

- 95% des patients sains doivent avoir un taux compris entre [moyenne - 2*écart-type ; moyenne + 2*écart-type]

et dans la série que nous propose coppersurfer, 80.3% (au lieu de 68%) des patients ont un taux compris entre [moyenne - écart-type ; moyenne + écart-type] -> critère 1 non respecté

Pour le deuxième critère, on est presque bon puisque 96.2% des patients ont un taux compris entre [moyenne - 2*écart-type ; moyenne + 2*écart-type] -> critère 2 pratiquement respecté

Peut-être nous faudrait-il toutes les données pour pouvoir dire?

Comment puis-je voir avec l ensemble de mes données si cela fait 68 ou 95%?

Sont-ce les 2 uniques critères pour dire que la loi est normale??

Merci.

Et bien en reprenant toutes mes valeurs, j observe que

  • 78,81% de mes patients sains ont un taux compris entre [moyenne - écart-type ; moyenne + écart-type] et que
  • 96,44% de mes patients sains ont un taux compris entre [moyenne - 2*écart-type ; moyenne + 2*écart-type]
  • 98,28% de mes patients sains ont un taux compris entre [moyenne - 3*écart-type ; moyenne + 3*écart-type]
Que puis je en déduire??

Je pense qu'on peut en déduire que cette série suit une distribution normale!

Parce que s'il y avait beaucoup plus de données, ça tendrait vers les 68 %.

Donc, je pense que tu peux prendre comme "bornes saines" [moyenne - 2*écart-type ; moyenne + 2*écart-type]

Merci à vous deux pour vos réponses!!

Je peux donc dire que la loi suit une distribution normale?? Pour formuler ma réponse, je dois donc dire " Sachant que la loi suit une distribution normale, 96,44% de mes patients sains ont un taux compris entre [moyenne - 2*écart-type ; moyenne + 2*écart-type]". Est-ce exact dans la formulation??

Salut coppersurfer,

Tu peux mettre : "Sachant que la série d'observations suit une distribution normale, 96,44% de mes patients sains ont un taux compris entre [moyenne - 2*écart-type ; moyenne + 2*écart-type]"

Par contre, si tu veux leur montrer comment tu as fait pour montrer que ça suivait une loi

normale, je viens de voir qu'il y a d'autres notions qui permettent de tester la normalité. Cela

fait intervenir des notions telles que coefficient d'asymétrie (Skewness), coefficient

d'aplatissement (Kurtosis).

A toi de voir

Apparemment selon le kurtosis et le coeff. d'asymétrie que j'obtiens, ma distribution aurait l'air assez pointue avec une disymétrie vers la droite. C'est ce que l'on m'a dit sur un forum de statistiques!!

Cependant je ne sais pas ce que cela m'apporte de dire cela dans ma thèse!!!

C'était juste pour qu'il sache que tu ne l'as pas sorti de nulle part

Rechercher des sujets similaires à "statistiques"