Statistique et base de donnée à 10 variables
Bonjour,
Je suis un nouveau venu sur le forum, j'ai cherché et je ne trouve pas de réponse à ma problématique.
Nous avons une base de données avec 10 variables qui nous donne un résultat en colonne L
Chaque variable va influencer plus ou moins le résultat final de la colonne L.
Ma volonté d’utiliser la base de données pour déduire le résultat si je ne rentre que les variables.
Est-il possible de faire un fichier Excel qui répond à cette problématique ?
Quelle doit être la taille de la base de données pour avoir des résultats probants dans l’analyse ?
Mes limites en excel et statistique sont trop limité pour cette problématique
Merci pour votre aide
Bonjour warreur et
Perso, je ne comprends pas votre demande
Ma volonté d’utiliser la base de données pour déduire le résultat si je ne rentre que les variables.
Est-il possible de faire un fichier Excel qui répond à cette problématique ?
Peut-être qu'avec un fichier joint et anonymisé, ce serait plus clair
A+
Bonjour,
Merci pour votre message, je vais expliquer avec un exemple :
J'ai une base de donné avec
- le nom de la personne
- nbre d'heure de sport pas semaine
- Nombre de km à pied / jour
- Nombre de fruit manger par jour
- Kg de viande manger par semaine
- + 6 autres variable qui a un impact sur la santé
Je connais l'âge de décès des personnes (mon résultat)
il y un lien entre l'âge du décès, si la personne fait du sport, son alimentation
Je voudrais faire un fichier excel qui me dit
Si je marche 5km mange 3 fruits et 2 kg de viande à quel âge statistiquement je risque de décéder ?
| Nom | nbre d'heure de sport pas semaine | Nombre de km à pied / jour | Nombre de fruit manger par jour | Kg de viande manger par semaine | Variable 5 | Variable 6 | Variable 7 | Variable 8 | Variable 9 | Variable 10 | age du décès |
| absolon | 2,03 | 7,6 | 1,84 | 6,17 | 2,63 | 2,14 | 0,78 | 1,86 | 6,7 | 3,76 | 18,85 |
| achille | 3,14 | 2,87 | 0,88 | 1,69 | 8,97 | 1,12 | 1,19 | 4,25 | 9 | 6,24 | 12,01 |
| adam | 6,01 | 0,55 | 4,7 | 2,83 | 7,95 | 2,15 | 5,05 | 2,79 | 6,04 | 9,81 | 89,36 |
| adélaïde | 4,25 | 6,1 | 5,66 | 2,26 | 2,81 | 8,42 | 6,73 | 4,7 | 9,86 | 1,97 | 18,69 |
| adèle | 9,11 | 6,97 | 5,64 | 8,87 | 3,21 | 5,8 | 6,69 | 1,44 | 0,05 | 7,26 | 45,37 |
| adeline | 6,94 | 2,37 | 1,74 | 3,54 | 7,63 | 9,51 | 6,53 | 0,53 | 7,52 | 8,85 | 61,67 |
| adolphe | 2 | 2,23 | 0,24 | 1,58 | 8,45 | 7,42 | 4,97 | 6,65 | 9,61 | 3,16 | 93,14 |
| adrien | 7,24 | 0,71 | 3,98 | 5,09 | 6,65 | 6,4 | 0,11 | 7,2 | 2,99 | 3,46 | 8,54 |
| adrienne | 9,28 | 3,55 | 4,61 | 4,6 | 3 | 5,8 | 4,6 | 9,09 | 9,63 | 7,37 | 66,66 |
| agathe | 3,9 | 0,11 | 0,78 | 1,41 | 4,21 | 5,23 | 7,35 | 0,34 | 7,78 | 5,6 | 83,64 |
| agnès | 1 | 0,38 | 3,29 | 4,37 | 6,46 | 9,73 | 0,93 | 0,09 | 7,35 | 5,74 | 44,41 |
| aimé | 1,2 | 1,77 | 9,65 | 3,02 | 7,63 | 4,51 | 5,83 | 9,22 | 0,34 | 4,64 | 87,15 |
| aimée | 1,49 | 8,59 | 5,36 | 7,61 | 4,37 | 8,06 | 1,43 | 4,36 | 4,54 | 8,06 | 84,36 |
| alain | 3,44 | 9,49 | 6,54 | 6,33 | 7,03 | 8,57 | 3,51 | 1,04 | 0,47 | 3,77 | 12,76 |
| albert | 5,75 | 0,37 | 3,87 | 6,65 | 8,59 | 0,56 | 7,59 | 9,11 | 5,85 | 4,37 | 59,23 |
| albertine | 0,21 | 0,82 | 5,79 | 7,05 | 4,06 | 3,03 | 8,2 | 2,62 | 9,14 | 7,83 | 52,08 |
| alexandre | 0,39 | 5,22 | 5,87 | 9,16 | 9,24 | 2,15 | 8,52 | 5,96 | 5,22 | 1,01 | 90,13 |
| alexandrie | 5,48 | 8,03 | 3,35 | 8,47 | 1,63 | 7,02 | 5,21 | 9,4 | 5,12 | 1,6 | 63,58 |
| alexis (1) | 2,26 | 6,55 | 8,42 | 8,79 | 5,7 | 9,18 | 1,19 | 7,62 | 1,64 | 5,45 | 94,66 |
Merci pour votre retour
bonjour,
les outils excel que tu peux utiliser pour cela (complément excel outils d'analyse)
analyse de la corrélation (pour vérifier quelles sont les variables qui sont corrélées à l'âge) et régression pour en déduire les coefficients de l'équation qui te permettra de calculer l'âge en fonction des valeurs introduites pour les différents paramètres.
Merci pour cette réponse, j'arrive à avancer en ayant la matrice de corrélation entre chaque variable, il me reste à comprendre comment avec des nouvelles valeurs faire le lien avec la matrice créée
bonjour,
je l'ai fait assez vite et je me souviens plus tous les théories là-dessus.
O1:Y7 = regression des 10 variables
puis pour chaque variable individuel son regression = les lignes 23-29 avec le résumé dans le tableau vert trié A31:C40.
Puis on commence à combiner plusieurs (2, 3, 4, 5, ....,10) variables à partir de la ligne 42 avec le résumé dans la plage E31:F40
Je ne sais pas vous expliquer, mais apparament et si je n'ai pas fait des erreur, mais je suppose si on prend variable 7 & 8 & 10 & 6 & 9 qu'on a déjà beaucoup et les autres n'ont pas une grande influence.