Filtrer valeurs aberrantes dans un TCD

Bonjour au forum,

Pas très à l'aise avec les TCD, je souhaiterais catégoriser des valeurs aberrantes dans un TCD pour qu'elles ne polluent pas mon graphique, en catégorisant par exemple toutes les valeurs <5.

Le fichier joint devrait représenter assez bien mon problème...

Merci d'avance aux experts !

30tcd.xlsx (23.44 Ko)

Bonjour,

Une proposition à étudier.

Cdlt.

79tcd.xlsx (29.34 Ko)

Bonjour Jean-Eric,

Merci pour ta réponse, cela fonctionne parfaitement, j'appliquais mes filtres au mauvais endroit.....

Ma base de données sera alimentée quotidiennement, sais-tu s'il est possible de filtrer automatiquement les valeurs aberrantes dans le temps (je pense par exemple à utiliser un pourcentage...) ?

Par exemple, en début d'année je n'aurai que quelques lignes de renseignées, admettons que le total d'incidents sera de 20.

10 pour le service X

8 pour le service Y

1 pour le service Z

1 pour le service S

J'aimerai dans ce cas ne "conserver" que les valeurs des services X et Y.

Les données étant alimentées régulièrement, je suppose qu'un tri sur le pourcentage est donc judicieux, mais est-ce possible ?

Y'a-t-il une possibilité de catégoriser les services dans une catégorie "valeurs insignifiantes" par exemple ?

L’intérêt est que, vu que le fichier est envoyé mensuellement aux différents services, j'aimerai que ceux qui sont dans cette catégorie puisse s'y voir...

Merci beaucoup pour l'aide !

bonjour

salut Jean-Eric

ce qui est "valeur aberrante" est-elle réellement aberrante ?

si oui,c'est un problème pour l'intelligence artificielle. Essaye Power BI desktop gratuit, il contient une fonction de clustering

Bonjour jmd,

Merci pour ton intérêt.

Je ne sais pas si le terme aberrant est adéquat.

Disons que si un service a un seul incident au mois de janvier et que 3 autres services en ont deux, il n’y a pas de valeur aberrante.

Mais si en décembre le service ayant eu un incident en janvier n’en a pas eu d’autres, alors que certains autres services en ont eu une cinquantaine, là l’incident isolé deviendrait insignifiant...

Concernant power bi, je n’ai malheureusement pas la possibilité de l’installer au travail, notre DSI est catégorique sur l’installation de logiciels...

re

ah.... les DSI qui datent des années 2000 !

pour te faire envie

https://docs.microsoft.com/fr-fr/power-bi/desktop-grouping-and-binning

et en plus il te laisse avec ton Excel d'avant la naissance des smartphones !

voici un groupement :

11copie-de-tcd.xlsx (33.07 Ko)

Bonjour à tous

@Nrev74 : ton profil indique 2016 donc tu as PowerQuery Intégré

Donc ci-joint une solution Powerquery qui filtre selon un seuil choisi et adaptable.

On pourrait aussi partir sur un top 5 et autres ou sur 80/20

19tcd-groupes.xlsx (31.66 Ko)

Bonjour jmd, 78chris,

Merci à vous pour vos réponses, et je m'excuse pour le retour aussi tardif.

@jmd : merci pour cette solution très intéressante, mais comment as-tu créé les "groupes" de données ? Comment es-tu arrivé à ça ?

@78chris : merci également à toi pour cette solution toute aussi intéressante... J'imagine que les "groupes" de données que tu as créé sont identiques dans la manière de faire que ceux du fichier de jmd ? Du coup j'ai un peu les mêmes questions... Comment es-tu arrivé à ça ? L'idée d'avoir un top 10 me séduit énormément, comment peut-on réaliser cela ?

Merci encore à vous, je pense que cela conviendra parfaitement une fois que j'aurai compris le fonctionnement...

Nicolas.

Bonjour,

Pour le fichier de Jean-Eric, il s'agit simplement d'un filtre numérique sur le nombre d'incidents, il demande d'afficher uniquement les valeurs supérieures à 1, pour faire ça il faut que tu affiches les champs d'en-tête dans ton TCD, tu as désactivé l'option visiblement, ensuite dans etiquettes de lignes tu peux filtrer suivant les valeurs que tu veux

L'autre fichier je ne sais pas trop...

Bonjour

@78chris : merci également à toi pour cette solution toute aussi intéressante... J'imagine que les "groupes" de données que tu as créé sont identiques dans la manière de faire que ceux du fichier de jmd ?

Non jmd a créé un tableau annexe et un TCD sur ce tableau.

Comme dit, mois je suis passé par PowerQuery avec un seuil réglable en G2

L'idée d'avoir un top 10 me séduit énormément, comment peut-on réaliser cela ?

Pour le top 5 (10 ici inclurait les 1 donc pas bon) il suffit dans un TCD standard de filtrer avec l'option 10 premiers en limitant à 5

Ok super, merci à vous je vais explorer ces solutions !

Bonne journée !

re à tous

Power BI Desktop gratuit propose une fonction de clusteurisation de données (méthode IA de K-Means) !

parfait pour distinguer des valeurs hors du groupe "normal".

à tester !

Merci jmd, je vais aller jeter un coup d’œil

Rechercher des sujets similaires à "filtrer valeurs aberrantes tcd"