Bonjour à tous,
Je travaille actuellement sur la mise en œuvre d'un échantillonnage aléatoire avec critères.
Ma base de données est issue de PowerBi et présente tous les dossiers créés la semaine précédente. Un nombre aléatoire est affecté à chaque dossier et change donc chaque semaine à chaque actualisation du dataset.
La base de données se présente dans un TCD de la manière suivante, avec des plages dynamiques nommées :
Dossier | Activité | Sous-Activité | Entreprise | Opérateur | Nombre aléatoire
J'ai besoin d'extraire les données selon les critères fictifs suivants :
Activité1(peu importe la sous-activité) : 5 dossiers
Activité1 et sous-activité1: 3 dossiers
Activité1 et sous-activité2: 1 dossier
Activité2 : 1 dossier
Activité3 : 1 dossier
etc....
J'arrive à générer mon échantillon selon ces critères en prenant les x plus grands nombres aléatoires selon ces mêmes critères (avec les fonctions FILTRE et GRANDE.VALEUR).
=FILTRE(CHOISIRCOLS(Donnees;1;2;4;5);GRANDE.VALEUR((Activité="Activité1")*nb_aleatoire;5)<=(Activité="Activité1")*nb_aleatoire;"")
=FILTRE(CHOISIRCOLS(Donnees;1;2;4;5);GRANDE.VALEUR((Activité="Activité1")*(Sous_Activité="Sous-Activité1")*nb_aleatoire;3)<=(Activité="Activité1")*(Sous_Activité="Sous-Activité1")*nb_aleatoire;"")
=FILTRE(CHOISIRCOLS(Donnees;1;2;4;5);GRANDE.VALEUR((Activité="Activité1")*(Sous_Activité="Sous-Activité2")*nb_aleatoire;1)<=(Activité="Activité1")*(Sous_Activité="Sous-Activité2")*nb_aleatoire;"")
Ma difficulté réside dans un autre critère à prendre en compte : je ne dois pas avoir dans l'absolu plusieurs fois la même entreprise et plusieurs fois le même opérateur dans l'échantillon final. Et ensuite, si je n'ai pas assez de dossiers pour compléter mon échantillon, alors je peux aller chercher un dossier avec une entreprise qui a déjà été sélectionnée ou un dossier avec un opérateur qui a déjà été sélectionné.
En sachant qu'une entreprise ou un opérateur ne sont pas liés à une seule activité.
Merci d'avance pour votre aide précieuse.
Cordialement,
Pierre.