Statistique et base de donnée à 10 variables

Bonjour,

Je suis un nouveau venu sur le forum, j'ai cherché et je ne trouve pas de réponse à ma problématique.

Nous avons une base de données avec 10 variables qui nous donne un résultat en colonne L

Chaque variable va influencer plus ou moins le résultat final de la colonne L.

Ma volonté d’utiliser la base de données pour déduire le résultat si je ne rentre que les variables.

Est-il possible de faire un fichier Excel qui répond à cette problématique ?

Quelle doit être la taille de la base de données pour avoir des résultats probants dans l’analyse ?

Mes limites en excel et statistique sont trop limité pour cette problématique

Merci pour votre aide

Bonjour warreur et

Perso, je ne comprends pas votre demande

Ma volonté d’utiliser la base de données pour déduire le résultat si je ne rentre que les variables.

Est-il possible de faire un fichier Excel qui répond à cette problématique ?

Peut-être qu'avec un fichier joint et anonymisé, ce serait plus clair

A+

Bonjour,

Merci pour votre message, je vais expliquer avec un exemple :

J'ai une base de donné avec

  • le nom de la personne
  • nbre d'heure de sport pas semaine
  • Nombre de km à pied / jour
  • Nombre de fruit manger par jour
  • Kg de viande manger par semaine
  • + 6 autres variable qui a un impact sur la santé

Je connais l'âge de décès des personnes (mon résultat)

il y un lien entre l'âge du décès, si la personne fait du sport, son alimentation

Je voudrais faire un fichier excel qui me dit

Si je marche 5km mange 3 fruits et 2 kg de viande à quel âge statistiquement je risque de décéder ?

Nom nbre d'heure de sport pas semaineNombre de km à pied / jourNombre de fruit manger par jourKg de viande manger par semaineVariable 5Variable 6Variable 7Variable 8Variable 9Variable 10age du décès
absolon2,037,61,846,172,632,140,781,866,73,7618,85
achille3,142,870,881,698,971,121,194,2596,2412,01
adam6,010,554,72,837,952,155,052,796,049,8189,36
adélaïde4,256,15,662,262,818,426,734,79,861,9718,69
adèle9,116,975,648,873,215,86,691,440,057,2645,37
adeline6,942,371,743,547,639,516,530,537,528,8561,67
adolphe22,230,241,588,457,424,976,659,613,1693,14
adrien7,240,713,985,096,656,40,117,22,993,468,54
adrienne9,283,554,614,635,84,69,099,637,3766,66
agathe3,90,110,781,414,215,237,350,347,785,683,64
agnès10,383,294,376,469,730,930,097,355,7444,41
aimé1,21,779,653,027,634,515,839,220,344,6487,15
aimée1,498,595,367,614,378,061,434,364,548,0684,36
alain3,449,496,546,337,038,573,511,040,473,7712,76
albert5,750,373,876,658,590,567,599,115,854,3759,23
albertine0,210,825,797,054,063,038,22,629,147,8352,08
alexandre0,395,225,879,169,242,158,525,965,221,0190,13
alexandrie5,488,033,358,471,637,025,219,45,121,663,58
alexis (1)2,266,558,428,795,79,181,197,621,645,4594,66

Merci pour votre retour

bonjour,

les outils excel que tu peux utiliser pour cela (complément excel outils d'analyse)

analyse de la corrélation (pour vérifier quelles sont les variables qui sont corrélées à l'âge) et régression pour en déduire les coefficients de l'équation qui te permettra de calculer l'âge en fonction des valeurs introduites pour les différents paramètres.

Merci pour cette réponse, j'arrive à avancer en ayant la matrice de corrélation entre chaque variable, il me reste à comprendre comment avec des nouvelles valeurs faire le lien avec la matrice créée

bonjour,

je l'ai fait assez vite et je me souviens plus tous les théories là-dessus.

O1:Y7 = regression des 10 variables

puis pour chaque variable individuel son regression = les lignes 23-29 avec le résumé dans le tableau vert trié A31:C40.

Puis on commence à combiner plusieurs (2, 3, 4, 5, ....,10) variables à partir de la ligne 42 avec le résumé dans la plage E31:F40

Je ne sais pas vous expliquer, mais apparament et si je n'ai pas fait des erreur, mais je suppose si on prend variable 7 & 8 & 10 & 6 & 9 qu'on a déjà beaucoup et les autres n'ont pas une grande influence.

9warreur.xlsm (39.06 Ko)
Rechercher des sujets similaires à "statistique base donnee variables"