Tri de données compliqué (lignes -> colonnes)

Bonjour,

J'ai un fichier contenant toutes les informations sur les élections présidentielles du premier tour, avec chaque ligne qui se présente de la sorte (avec quelques colonnes en plus, mais c'est pour schématiser) :

Nom Departement1 - Ville1 - Nb Voix Totales - Nom Candidat 1 - Nb Voix Candidat 1 - % de Voix Candidat 1- Nom Candidat 2 - Nb Voix Candidat 2 - % de Voix Candidat 2....

Nom Departement1 - Ville2 - Nb Voix Totales - Nom Candidat 1 - Nb Voix Candidat 1 - % de Voix Candidat 1 - Nom Candidat 2 - Nb Voix Candidat 2... - % de Voix Candidat 2...

Je souhaiterais combiner toutes les lignes afin de n'avoir que des départements à la fin, mais aussi d'avoir chaque candidat sur chaque ligne plutot que tout les résultats d'un département sur une ligne, autrement dit, je souhaiterais que les données finales ressemblent à ça :

Nom Departement1 - Nom Candidat 1 - % Voix Candidat 1

Nom Departement1 - Nom Candidat 2 - % Voix Candidat 2

A savoir que tout ce qui n'est pas des voix exprimées (vote blanc, abstentions etc..) a déjà été trié, donc les voix totales correspondent bien à la sommes des voix de chaque candidat sur une ligne, et qu'il n'y a pas une ligne "total" par département, sinon le problème serait presque résolu.

Ma première idée était de créer une ligne total en dessous de chaque département, de sommer les voix et de faire les pourcentages avec des formules, mais pour une centaine de départements cela paraît bien trop long.

Cela permettrait de réduire les données d'environ 70 000 lignes à 96 (nombre de départements) * 12 (nombre de candidats au premier tour), soit 1152.

Je fournis un bout du fichier en pièce jointe, car il est trop gros pour être uploadé sinon.

Merci d'avance

Bonjour,

Plutôt que d'avoir 1152 lignes, ne serait-ce pas plus lisible s'il n'y en avait que le même nombre de départements? comme ceci:

ulqiqi

le fichier:

Attention, les formules vont chercher jusqu'à la 70000è ligne de la feuille "Sheet1", il faudra sûrement changer ce nombre pour couvrir l'ensemble des données jusqu'à la dernière ligne de cette feuille.

Cdlt

Bonjour,

Ce jeu de données va être utilisé avec d'autres jeux de données qui eux ont chacun un seul candidat par ligne, donc j'ai peur qu'en laissant les candidats en colonne cela complique énormément les requêtes SQL. Merci de votre aide néanmoins.

Bonjour à tous !

Et....

Une proposition via Power Query ? (nativement intégré dans Excel 2021) :

Bonjour JFL et merci pour votre aide.

Je ne suis pas très familier avec Power Query, pourriez vous m'expliquer la démarche à suivre afin que je fasse la même chose sur le jeu de données au complet ? De plus, dans votre réponse, les villes sont toujours présentes, et je préfererais une seule ligne par département par candidat, qui serait la somme de toutes les villes du département, en supprimant totalement les villes.

Bonsoir à tous !

Version 2 amendée :

C'est toujours délicat d'expliquer brièvement la philosophie Power Query tant cet outil est vaste....

Sommairement, la requête vise à réaménager votre source afin de la rendre exploitable (un champ = un type de données). Ce retraitement représente +/- 90% du étapes de la requête. La suite n'est qu'affaire de sommation et calcul de %. Simple à réaliser.

Concernant votre jeu de données plus complet, si vous respectez le nom de la source (t_BDD), le traitement Power Query (et sa restitution), devrait suivre sans difficulté. Enfin.... c'est mon souhait ! .

Le web regorge de tutoriels pour vous accompagner dans votre démarche d'apprentissage de Power Query.

Bonjour,

SInon avec une méthode plus classique en VBA, ouvrez le fichier et cliquez sur le bouton jaune "Résultats des élections" (mais la méthode avec Power Query est à prioriser)

Cdlt

Rechercher des sujets similaires à "tri donnees complique lignes colonnes"