Comparaison de fichiers Excel 2010

Bonjour à tous,

Voici la problématique qui m'amène à publier ce message.

Je travaille à l'amélioration de la qualité de données de spécification de produits techniques.

Je cherche à comparer les valeurs des 126 attributs de spécification pour plusieurs centaines de produits (nombre exact inconnu) hiérarchisés 37 en familles.

Je dispose pour cela pour chacune des familles de deux fichiers au format Excel 2010:

  • l'un extrait* en mai 2013
  • l'autre extrait* en août 2013
* le système duquel ces fichiers sont extraits est un PIM (Product Information Management System) auquel je n'ai pas accès.

Chaque fichier est composé de:

  • 126 colonnes: chaque colonne correspond à un attribut
  • 1 à plusieurs centaines de lignes*: chaque ligne correspond à un produit (200 lignes par fichier environ)
* le nombre de lignes des deux fichiers d'une famille donnée n'est en général pas le même: entre deux extractions (mai et août dans le cas présent), des produits anciens peuvent avoir été supprimés ou des produits nouveaux créés au sein d'une famille.

Mon objectif:

Automatiser les tâches consistant, pour chaque famille, à:

  • comparer les deux fichiers d'extraction afin identifier les produits communs
  • pour les produits communs: comparer pour chaque attribut, la valeur renseignée dans chacun des fichiers
  • générer le résultat de ces tâches dans un nouveau fichier (ou une nouvelle feuille excel) sous la forme suivante:
* afficher, l'une en dessous de l'autre, les lignes (mai et août) des produits ayant au moins une valeur d'attribut différente

* rendre visible en les marquant d'une couleur, les valeurs d'août 2013 différentes de celles de mai 2013

S'il existe une solution, celà me permettrait à la fois:

  • de gagner beaucoup de temps
  • d'éviter des risques importants d'erreur de lecture oculaire

L'un(e) de vous connait-il(elle) une solution qui permettrait d'automatiser ces tâches?

Par avance: merci beaucoup pour vos retours!

Cordialement

Zeinebas

Bonsoir,

Je laisse le soin au forum (plus particulièrement à banzai64 )

Bonsoir Banzai64

pour répondre favorablement à la question posée...

Cdlt

Bonjour

@ Jean-Eric:

merci pour ton message !

@ Banzai64:

s'il te faut plus de détails, n'hésite pas à le signaler,

et d'avance: merci !

Bon aprem

Zeinebas

Bonjour

@Jean-Eric:

Merci de ta sollicitude mais ..... je n'aime pas que l'on me force la main (pour la prochaine fois)

Et je suis loin de valoir certain membres de ce forum

@zeinebas

Sans fichier ce n'est pas la peine de chercher

Bonsoir,

@Banzai64:

merci pour ton retour.

à lire son message, j'avais déduit que Jean-Eric et toi vous connaissiez et qu'il s'agissait plus d'un clin d'oeil qu'autre chose

navrée si tel n'était pas le cas

... ça me mets pas super à l'aise tout ça pour un premier poste sur ce forum, mais bon ...

concernant les fichiers:

attacher en pièces jointes 37x2 fichiers de 126 colonnes et +/- 200 lignes chacun ... ça m'a semblé un peu bcp ...

est-ce que deux fichier ne comportant qu'une partie des lignes par exemple pourrait suffire?

Bonne soirée

Zeinebas

Bonsoir

Ne t'inquiètes pas, je prends comme un compliment que l'on pense à moi pour aider, je voudrais seulement que cela soit en silence

Il ne faut pas la totalité des tes fichiers mais les fichiers (pour 2 familles) ayant la même structure que les fichiers réels, avec quand même des données

La liste de familles

Comment est structuré le nom des fichiers

Le fichier dans lequel tu veux les résultats des comparaisons dans lequel tu auras fait un (ou plusieurs) exemple(s) de ce que tu veux obtenir

Bonsoir Banzai64,

Me voilà rassurée

C'est top merci bcp d'accepter de m'aider

Tu trouveras ci-joint:

- un fichier répertoriant la liste des noms des fichiers sources sur deux feuilles:

* une feuille pour l'extraction de mai

* une feuille pour l'extraction d'août

=> Comme tu pourras le constater: Il y a 37 familles communes aux deux fichiers.

Cependant, de la même manière qu'au sein d'une même famille, certains produits peuvent avoir été supprimés ou créés entre deux extractions, certaines familles peuvent avoir été supprimées ou créées entre deux extractions.

- deux fichiers d'extraction (mai et août) correspondant à une même famille.

> les lignes sont triées par ordre croissant selon la colonne A

> toutes les colonnes y sont

- un fichier d'exemple du résultat que je souhaiterais obtenir (les valeurs sont indiquées au hasard, uniquement pour donner un exemple de rendu. Elles ne correspondent pas forcément à des valeurs existantes dans les fichiers d'extraction).

J'espère que cela convient ainsi.

PS: En fait, j'ai essayé de m'en sortir avec les fonctions "standards" d'Excel, sans parvenir au résultat que je souhaite

Toutefois, si celà peut t'être utile, voici pour info ce que j'ai fait sur la base de la famille prise en exemple:

> rapatriement des deux feuilles Excel sources -à l'origine dans deux fichiers différents- sur deux feuilles d'un même fichier

> fonction "Sort" (=trie croissant) selon le code produit (colonne A) dans chaque fichier

> fonction "Match" (donne le N° de la ligne correspondant au produit identique dans le fichier de comparaison)

> fonction "RechercheV" (rapatrie les données du produit (ligne) identique du fichier de comparaison)

Celà m'a permis d'obtenir deux fichiers sources "bis" ne comportant chacun que les valeurs des produits présents dans les deux fichiers sources et rangés dans l'ordre croissant. Après, je bloque et le résultat reste fastidieux et source potentiel d'erreurs pour un contrôle oculaire.

Je peux t'envoyer ce que j'ai obtenu comme résultat si tu veux.

D'avance, merci encore!

Cordialement

Zeinebas

35excel.zip (220.83 Ko)

Bonjour

Bon je vais te dire ce que j'en pense : C'est pas gagné

Une famille c'est quoi parce que

zeinebas a écrit :

Comme tu pourras le constater: Il y a 37 familles communes aux deux fichiers.

et bien non je n'ai pas constaté

Ensuite comment reconnaitre les fichier d'extraction de Mai et d'Août pour une famille ?

Comment avec ce nom BVP506i_HL01_10NC_20130426_135145-2.xls tu peux savoir qu'il est du moi de Mai

Pour le moment ce sont les seules questions qui me viennent à l'esprit

... j'avais quasiment fini de répondre à tes deux questions quand je me suis vue renvoyée à la page d'accueil … ne m’en veux pas, mais je ferai bref du coup …

Question 1:

* Les familles sont toutes identifiables par un code famille de type "ABC123i" (BVP506i dans ton exemple).

* Les noms des fichiers d'extractions ont tous la même structure et comportent notamment tous le code famille comme « bloc d’info ».

* Après avoir généré la liste des fichiers (reçus sous forme de dossier) à deux moments différents (mai et aout) grâce à un gratuiciel,

* j'ai scindé les « blocs d'info » (ceux qui composent le nom d'un fichier) en me basant sur le séparateur "_" (excel propose une fonction qui fait ça).

* Puis, j'ai effectué une "rechercheV" dans chacun des fichiers sur la base de la 1ère colonne (celle qui contient le code famille isolé).

* Celà m'a permis de constater que des fichiers d'extraction existaient dans les deux dossiers d'extraction (mai et aout) pour 37 familles.

Question 2:

* Mai et Aout sont les mois auxquels un dossier contenant des fichiers d'extraction m'ont été envoyés.

* Ayant reçu les fichiers dans deux dossiers bien distincts à 3 moins d'écart, je ne me suis pas posée la question de la date …

* Ceci dit, pour répondre à la question "comment reconnaitre la date d'extraction d'un fichier sur la base de son nom?" …

* … un autre « bloc d’info » constitutif du nom du fichier semble être une date : celle de l’extraction du fichier à priori, le 26 avril 2013 dans ton exemple (« 20130426 », soit le 4ème bloc). Cette hypothèse serait plus que probable, car j’ai reçu le premier dossier d’extractions début mai et le second début août. Aussi, tu pourrais raisonnablement te baser sur cette donnée pour répondre à ta question je pense.

Voilà. J’espère que ces précisions seront utiles.

Quoiqu’il en soit : encore merci de te pencher sur cette problématique Bonzaï64 !

Bonne soirée !

Zeinebas

Bonsoir

Bon je vais essayer de comprendre ce que tu as noté

Déjà une famille est composée des 7 premiers caractères - Exact ?

Pour la liste d'extraction du mois de mai (54 fichiers) dont une famille en double

Le fichier "BGP352i_HL01_10NC_20130426_134332-2.xls" et le fichier "BGP352i_KT01_10NC_20130426_134335-2.xls"

Lequel il faudra prendre ?

Dans cette liste on a 53 familles : On est loin des 37 familles annoncées

Pour la liste d'extraction du mois d'Août (38 fichiers) ==> 38 familles et parmi ces 38 familles 26 familles communes à celles de Mai

Pour comparer on prendra 2 fichiers ayant la même famille en commun, un avec la date inférieure ou égale à mai et l'autre avec la date inférieure ou égale à Août - Exact ?

Afin de digérer tout ça je te laisse découvrir la première version

A toi de dire ce qui ne va pas

Waouw ... je suis scotchée par ta réactitivé et ta rapidité ... chapeau bas !

* je te confirme que le "code famille industrielle" (je n'étais pas entrée dans ce niveau de détail, mais c'est bien à celà que ça correspond dans les faits) est un code significatif composé de trois lettres majuscules suivies de trois chiffres et se terminant pas la lettre i minuscule, soit 7 caractères attachés en tout.

* les codes HL01 et KT01 correspondent à des codes usines.

C'est rare, mais il arrive qu'une famille de produits puisse être fabriquée sur deux sites industriels différents en même temps. C'est manifestement le cas de la famille BGP352i. J'ai ouvert les deux fichiers. Ils comportent tous exactement le même nombre de colonnes correspondant aux mêmes attributs, et au niveau des lignes, des produits strictement différents (les variantes de produits de cette famille fabriquées sont un site donné ne sont pas fabriquées sur le second site et réciproquement).

Aussi, idéalement, il faudrait fusionner les deux fichiers (copier-coller les lignes de l'un dans l'autre plus exactement), puis ajouter une colonne indiquant le lieu de fabrication du produit pour ne pas perdre cette info.

* Exact: le fichier listant les noms des fichiers d'extraction de mai laisse apparaitre 53 codes familles industrielles différents.

* Celui listant ceux d'aout en laisse apparaitre 38.

* Je n'ai pas encore refait mon croisement (rechercheV) mais si tu dis qu'il n'y a que 26 codes familles communs aux des listings de fichiers ... celà s'impose ! Je le ferai demain si tu veux bien: il est un peu tard là.

=> bon: navée pour cette erreur s'il s'avère en être une!

[/qote]: "Pour comparer on prendra 2 fichiers ayant la même famille en commun, un avec la date inférieure ou égale à mai et l'autre avec la date inférieure ou égale à Août - Exact ? " [/quote]

=> oui: c'est bien celà, sauf que pour "l'autre" fichier, la doute doit être inférieur ou égale à aout, mais supérieur à avril/mai !

Un très grand merci pour ton livrable et le super beau bouton "compare" !

... bon par conte, je ne sais pas si c'est lié à mon appli excel, mais ... il y a un bug qui veut pas partir et qui m'empêche de voir le résultat de ta macro ... je vois juste le code !

Bon we!

Zeinebas

Bonjour

Quelques précisions/questions/demandes supplémentaires

Pourquoi l'on ne compare pas les deux fichiers ayant la même famille fabriqué sur le même site, ce qui règle le problème du fichier supplémentaire du mois de Mai, car son pendant du mois d'Août (même famille - même site) n'existe pas

Je me vois mal à chercher les fichiers pour les fusionner

Tu veux toutes les comparaisons sur le même fichier ?

Les unes à la suite des autres sur la même page ?

Il me faudrait des fichiers réels afin que développe la macro de recherche des fichiers

Les fichiers sont-ils tous dans le même répertoire ?

Plus facile si 2 répertoires differents

Dans la macro j'ai considéré que le "Tech Prod Code" est un code unique associée au produit - Exact ?

Je ne sais pas pourquoi tu ne peux pas voir le résultat

Ton niveau de sécurité des macro est-il bien réglé ?

Voir ici http://office.microsoft.com/fr-fr/excel-help/modifier-les-parametres-de-securite-des-macros-dans-excel-HP010342232.aspx

Bonjour Banzai64

1/

Banzai64 a écrit :

Pourquoi l'on ne compare pas les deux fichiers ayant la même famille fabriqué sur le même site, ce qui règle le problème du fichier supplémentaire du mois de Mai, car son pendant du mois d'Août (même famille - même site) n'existe pas

?

... pas sûr d'avoir bien compris ta question ... dois-je comprendre "pourquoi ne compare-ton pas entre-eux les deux fichiers de la même famille produite sur deux sites différents[/b]"?

Si c'est bien là ta question ... en effet, pourquoi pas ... deux bémols toutefois:

> les produits fabriqués sur deux sites différents sont des versions différentes d'un même famille

(aucun code 12NC commun aux deux fichiers) => aucune comparaison possible par conséquent

> les extractions de mai ont servi de base au nettoyage des données. Celles d'août servent à mesurer le % de données nettoyées et ce faisant, à avoir un indice de mesure de la qualité des données. Aussi: ou est l'intérêt de comparer deux fichiers extraits le même moi, tous deux avant que le nettoyage ait eu lieu?

2/

Banzai64 a écrit :

Tu veux toutes les comparaisons sur le même fichier ?

Idéalement, ce serait top si je pouvais avoir par famille:

  • soit un fichier excel distinct
  • soit une feuille excel distincte d'un fichier excel unique

3/

Banzai64 a écrit :

Les unes à la suite des autres sur la même page ?

... ben du coup, non ... pas les eux à la suite des autres ... et pas sur une même page ...

... euh, si c'est pas trop demandé hein, bien sûr !

4/

zeinebas a écrit :

Il me faudrait des fichiers réels afin que développe la macro de recherche des fichiers

Les fichiers sont-ils tous dans le même répertoire ?

Plus facile si 2 répertoires differents

... ben en fait, il s'agit déjà de fichier réels. Seules les valeurs des données à l'intérieur des fichiers ne correspondent pas aux données réelles des produits correspondants!

... je ne sais pas si ce que tu entends pas "répertoire" est ce que j'appelle "dossier" dans un précédant message, mais si tel est le cas:

  • les fichiers des extractions de mai sont toutes dans un même dossier
  • les fichiers des extractions d'août sont toutes dans un même dossier différent de celles de mai

4/

zeinebas a écrit :

Dans la macro j'ai considéré que le "Tech Prod Code" est un code unique associée au produit - Exact ?

Tout à fait exact! Il s'agit d'un code d'identification unique d'un produit donné.

5/

zeinebas a écrit :

Je ne sais pas pourquoi tu ne peux pas voir le résultat

Ton niveau de sécurité des macro est-il bien réglé ?

Je n'ai pas encore consulté le lien que tu m'as envoyé (merci pour ce lien!) mais j'ai relancé ta macro ce matin et cette fois-ci, lu le contenu des messages d'erreur. En fait, depuis que je te les ai envoyés, j'ai "rangé" les fichiers contenant les listes des noms des fichiers d'extraction dans un autre dossier. Apparemment, c'est ce qui dérangeait la macro qui ne les retrouvait plus. Je les ai remis à la place où ils étaient lorsque je te les ai envoyés et la ça fonctionne apparemment. Sorry pour la boulette si c'en est une.

Juste pour ton info:

  • la page d'accueil sur laquelle tu as installé le bouton comparé et copié le "cahier des charges" de ma demande (mon premier mail), apparait comme "collée" par dessus la feuille de résultats. C'est normal docteur?
  • pour un attribut donné et un produit donné, lorsque les valeurs sont différentes:
* la première (celle de mai?) apparait en jaune,

* la seconde (celle d'aout?) apparait en vert.

Est-ce bien celà que je dois voir?

Quoiqu'il en soit: c'est nickel comme ça !

Ca va me faire énormément gagner, en temps et en qualité

... Au fait ... petite question ... admettons qu'on puisse avoir le cas de figure suivant:

- la valeur d'une cellule est vide dans l'un des fichiers mais pas dans l'autre ... est-ce aussi ce que je verrai dans le fichier de résultat? Les cellules apparaitraient-elles en couleur (jaune et vert) dans un tel cas?

J'espère que ces réponses à tes précisions/questions/demandes supplémentaires y répondent comme tu le souhaites!

Merci!

Bon we!

Zeinebas

Bonjour

Que de lecture ce matin

Quand je marque la même famille fabriqué sur le même site cela ne veut pas dire

zeinebas a écrit :

la même famille produite sur deux sites différents

Ce qui réglerait le problème des fichiers

Pour Mai

BGP352i_HL01_10NC_20130426_134332-2.xls

BGP352i_KT01_10NC_20130426_134335-2.xls

Pour Août

BGP352i_KT01_10NC_20130725_094022-2.xls

dans ce cas là on ne comparerait que les 2 fichiers surlignés

Pour les fichiers il me faut des fichiers ayant comme nom des noms que l'on pourrait trouver, même si chacun contient une dizaine de ligne (avec des différences bien sur)

zeinebas a écrit :

- la page d'accueil sur laquelle tu as installé le bouton comparé et copié le "cahier des charges" de ma demande (mon premier mail), apparait comme "collée" par dessus la feuille de résultats. C'est normal docteur?

Oui si cela te gène supprimes les boites de texte

zeinebas a écrit :

- pour un attribut donné et un produit donné, lorsque les valeurs sont différentes:

* la première (celle de mai?) apparait en jaune,

* la seconde (celle d'aout?) apparait en vert.

Est-ce bien celà que je dois voir?

Oui, Oui et Oui

zeinebas a écrit :

- la valeur d'une cellule est vide dans l'un des fichiers mais pas dans l'autre ... est-ce aussi ce que je verrai dans le fichier de résultat? Les cellules apparaitraient-elles en couleur (jaune et vert) dans un tel cas?

Si une différence existe entre les deux données elle sera notée

Répertoire/Dossier même combat

1/ sorry si la tentative d'interprétation est fausse, mais dans ce cas, je te confirme que je ne comprends pas la question ci-dessous:

Banzai64 a écrit :

Pourquoi l'on ne compare pas les deux fichiers ayant la même famille fabriqué sur le même site, ce qui règle le problème du fichier supplémentaire du mois de Mai, car son pendant du mois d'Août (même famille - même site) n'existe pas

Je me vois mal à chercher les fichiers pour les fusionner

=> Navrée de le dire tel que, mais elle n'a aucun sens pour moi ... comparer deux extractions effectuées à deux dates différentes pour une même famille de produits fabriqués sur un même site ... c'est bien ce que l'on cherche à faire, non?!? ... franchement, j'ai beau la relire, je ne comprends pas le sens de la question, même avec un exemple à l'appui

2/ Nom des fichiers

Ben, comme je te le disais, les noms des fichiers qui figurent dans les listes sont les noms des fichiers que j'ai reçus ... on peut pas faire plus authentique là pour le coup ...

Quant au contenu: il faudrait que je t'envoie les 2x26 fichiers comportant chacun 10 lignes, c'est ça? ... ça me parait bcp en pj non?

3/ 4/ 5/ 6/ => OK! Thx

Bonjour

Bon pour essayer de clore au sujet des noms de fichiers de plusieurs sites

Imagines

Famille1_Paris_Mai

Famille1_Lyon_Mai

Famille1_Paris_Août

On a bien 2 familles identiques au mois de Mai (une fabriquée à Paris et l'autre à Lyon) pour faire la comparaison il vaut vieux prendre bien sur la même famille mais fabriquée au même endroit, donc on comparera seulement "Famille1_Paris_Mai" avec "Famille1_Paris_Août"

Je ne sais pas expliquer autrement

zeinebas a écrit :

Quant au contenu: il faudrait que je t'envoie les 2x26 fichiers comportant chacun 10 lignes, c'est ça? ... ça me parait bcp en pj non?

Non car compressé cela ne devrait pas prendre beaucoup de place (et en plus il y a Cjoint)

Mais ce n'est pas exactement ce que je veux

Quelques fichiers(plus il y en aura plus le test sera probant) , avec leurs vrais noms donc certains avec leur "homologue" absent

Une question : La comparaison doit débuter à quelle colonne ?

1/

En fait, c'est pas tant que je ne comprenne pas ce que tu veux dire.

Ce que je ne comprends pas, c'est là où tu veux en venir, et la raison pour laquelle tu pointes ce cas de figure du doigt ...

Je me permets juste de répéter et d'insister sur le fait suivant:

  • ce sont avant tout des produits que les usines fabriquent et non des familles
  • un produit donné ne peut-être fabriqué que dans une seule usine à un moment donné
(alors que la fabrication des produits d'une même génération d'une même famille, peut être répartie sur différents sites)

=> Autrement dit: les produits de la famille BGP352i qui sont fabriqués à HL01 sont nécessairement différents de ceux qui sont fabriqués à KT01.

Une fois celà dit:

  • Si je reçois deux fichiers (l'un en mai, l'autre en aout) pour les produits de la famille BGP352i fabriqués à KT01, alors je peux les comparer entre eux
  • Si par contre, je ne reçois qu'un fichier (que celui de mai ou que celui d'aout) pour les produits de la famille BGP352i fabriqués à HL01, alors fatalement, je ne risque pas de le comparer à quoique ce soit !!!

Si c'est ce cas de figure que tu pointes du doigt, alors en ce qui me concerne, on peut clore le sujet!

2/

zeinebas a écrit :

Non car compressé cela ne devrait pas prendre beaucoup de place (et en plus il y a Cjoint)

=> C'est quoi "Cjoint"?

3/

zeinebas a écrit :

Quelques fichiers (plus il y en aura plus le test sera probant) , avec leurs vrais noms donc certains avec leur "homologue" absent

=> comme je te le disais: tous les fichiers sans exception ont leur vrai nom

=> tu es vraiment tombé sur un cas rare avec la famille BGP352i, car il est rare que des produits appartenant à une même famille industrielle soient fabriqués sur deux sites différents ... je ne te promet donc pas que tu trouveras bcp d'autres exemples de fichiers n'ayant pas d'"homolgue" comme tu dis.

Ce qui risque d'être bien plus fréquent, est que des produits appartenant à la même famille et produits sur le même site, soient présents dans l'une des extractions (celle de mai par exemple) mais pas dans l'autre (celle d'aout par exemple).

Ca va me prendre un peu de temps, car si tu veux tous les fichiers des deux dossiers d'extraction ( 54 fichiers pour le dossier d'extractions reçues en mai, 37 fichiers pour les dossiers d'aout) avec pour chaque fichier au minimum 10 lignes,

il va d'abord falloir que je les modifie (que je les peuple de valeurs fictives pertinentes pour la macro) un par un avant de pouvoir te les envoyer. Sans compter qu'il y a également dans le dossier de mai, des fichiers d'extractions d'autres familles de produits qui ne font pas parties du périmètre du travail de "nettoyage/revue qualité": il va falloir que je les retire un par un du dossier avant de modifier les fichiers restants (un par un aussi) puis de compresser et t'envoyer le tout ... ça risque d'être un peu long ...

Te faut-il vraiment la totalité des fichiers des deux dossiers d'extraction? ... 10 fichiers par dossier, ça pourrait faire l'affaire?

De toutes façons, on ne garderait que 10 lignes par fichiers et vu qu'il y a bien plus de lignes par fichier que de fichiers par dossier ... proportionnellement, on ne devrait pas prendre des risques plus grand en ne conservant que 10 fichiers ...

Qu'en penses-tu?

4/

zeinebas a écrit :

Une question : La comparaison doit débuter à quelle colonne ?

=> pour faciliter la lecture, je souhaiterais que l'ordre des colonnes reste le même et donc que la comparaison débute par la colonne la plus à gauche et par la ligne la plus en haut du fichier (je ne sais pas toi, mais moi je lis de gauche à droite et de haut en bas ).

Je me reconnecterai demain matin seulement, ok?

Bonne soirée

et encore merci pour toute cette aide!

Zeinebas

Bonsoir

Je ne sais si je vais continuer, tu ne lis pas les réponses

Pourquoi tu me parles de 2 fichiers - Si je reçois deux fichiers (l'un en mai, l'autre en aout) alors que moi je t'en indique 3

  1. Famille1_Paris_Mai
  2. Famille1_Lyon_Mai
  3. Famille1_Paris_Août

Alors si tu admets qu'il y a 3 fichiers ayant la même famille on va pouvoir avancer

Dans ce cas où il y a 3 fichiers ayant la même famille on ne comparera que les 2 fichiers dont la famille est fabriquée dans le même site

Dans ce cas on comparera Famille1_Paris_Mai avec Famille1_Paris_Août

As-tu compris ce que je veux dire cette fois ?

zeinebas a écrit :

Si par contre, je ne reçois qu'un fichier (que celui de mai ou que celui d'aout) pour les produits de la famille BGP352i fabriqués à HL01, alors fatalement, je ne risque pas de le comparer à quoique ce soit !!!

Si en plus tu me prends pour un idiot cela ne va pas le faire
zeinebas a écrit :

C'est quoi "Cjoint"?

C'est un site dans lequel tu peux déposer des fichiers à télécharger, en gros tu copies ton fichier sur le site, le site te donne un lien que tu copies dans le message sur le forum

Utilisé lorsque la taille du fichier dépasse 300Ko

Lien du site : http://cjoint.com/index.php

zeinebas a écrit :

car si tu veux tous les fichiers des deux dossiers d'extraction

Je ne t'ai pas demandé tous mais le maximum (subtile différence)

3-4 de chaque extraction, bien sur des fichiers familles uniques et des fichiers familles communes (une dizaine de lignes par fichier devrait suffire)

zeinebas a écrit :

et donc que la comparaison débute par la colonne la plus à gauche et par la ligne la plus en haut du fichier (je ne sais pas toi, mais moi je lis de gauche à droite et de haut en bas ).

Attention tu pousses le bouchon un peu loin

Je t'ai demandé

Banzai64 a écrit :

La comparaison doit débuter à quelle colonne ?

je m'attendais à une réponse style "La colonne D" ou encore "la 6ème colonne"

Alors une réponse "la plus à gauche" ne veut rien dire

De fait les 2 premières colonnes sont automatiquement identiques, ensuite dans les fichiers en ma possession (je ne sais pas si c'est la règle) les colonnes C à F sont vides

Alors on peut commencer la comparaison en colonne G (comme fait actuellement) ou H

Donnes une réponse claire

Et pour la ligne (que je ne t'ai pas demandé - mais que tu as quand même indiqué) ce n'est pas la ligne la plus haut mais la ligne 4

1/

On parle exactement du même nombre de fichier:

2+1, ça fait 3 pour moi

tout comme ton 1+1+1

Alors si tu y tiens va pour 1+1+1

Sauf que c'est pas sous cette forme de groupement que je reçois les fichiers

L'essentiel c'est que tu te comprennes et que tu n'aies pas besoin de ma part d'une réponse qui pourrait être bloquante pour toi

Quand à BGP352i, si ça te semble plus claire de l'appeler Famille1, va pour Famille1!

Idem pour Paris versus KT01 et Lyon pour HL01!

J'ai un peu autre chose à faire qu'à prendre les gens qui m'aident pour des idiots en fait

Ca arrive qu'on ait des façons différentes de voir les choses, ça veut pas dire pour autant que l'une est fausse ou idiote

J'essayais juste tout comme toi d'exprimer ma façon de voir les choses

Rien de plus

Mais encore une fois: du moment qu'il ne s'agit pas d'un point bloquant, je ne vois pas le problème de lâcher prise sur ce point

2/

Ca serait sympa que tu n'aies pas comme préjugé que je me fiche de toi.

La réponse que je t'ai faite est celle qui pour moi me paraissait la plus claire possible

Alors désolée si ce n'est pas la réponse que tu attendais, mais je ne suis pas dans ta tête

Donc oui:

Si la colonne la plus à gauche s'appelle "colonne A" ou "colonne 1" moi ça me va!

Quant au fait que tu lises aussi "culturellement/naturellement" de gauche à droite et de haut en bas, ça non plus je ne peux pas le deviner. J'ai un collègue chinois pour qui ce n'est pas le cas par exemple. Je pensais sincèrement que c'est pour ça que tu posais la question. Que tu me crois ou non, peu m'importe.

Pour moi par exemple, ça va de soi que tous les attributs (toutes les colonnes si tu préfères) sans exception doivent être comparés. Que certaines n'aient pas de valeurs, n'est pas une règle générale.

D'où la précision (non demandée) pour les lignes (je pensais bien faire), pour dire que de la même manière que tous les attributs de caractérisation d'un produit d'une famille doivent être comparer, celà doit être fait pour tous les produits de cette famille.

ok. Donc, si tu acceptes de continuer à m'aider, je t'enverrai demain 4 fichiers de chacun des deux dossiers comportant chacun 10 lignes.

Mais il ne faudra pas m'en vouloir et me dire que j'ai mal lu ton mail ou que je me fiche de toi si tu ne retrouves pas la proportion de fichiers qui n'ont pas d'homologues que tu t'attends à trouver.

D'abord parce que je ne sais pas à quoi tu t'attends (!) et puis parce que comme je l'ai écrit précédemment, le cas particulier de la "famille1" (BGP352i) est rare !!!

Voilà.

Sur ce: merci pour ton aide et bonne soirée à toi.

zeinebas

Bonsoir Banzai64,

*Ca y est: j'ai préparé les fichiers.

*Comme tu pourras le constater: il y en a 12 en tous.

*Comme tu le constatera aussi, j'ai laissé le même nombre de lignes qu'à l'origine plutôt que de le limiter à 10 comme initialement convenu et ce parce que comme tu le verras par toi-même, la différence du nombre de lignes peut être importante.

*J'ai mis tous les fichiers dans le même dossier comme tu le verras, car étant données les dates qui figurent dans le nom des fichiers, je n'ai pas pensé nécessaire de faire deux fichiers (l'un qui s'appellerait mai, l'autre qui s'appellerait aout). Toutefois, ne sachant pas si celà peut être gênant pour toi & ta macro, n'hésite pas à me le dire si il te faut les "vrais chemins d'accès aux dossiers (ex: C/Documents/EcoPassport/Extractions)".

*Tu trouveras également un fichier qui contient les noms de fichiers comparés et que j'ai fait pour essayer tant que possible de t'envoyer des fichiers tests représentatifs de la diversité des cas de figure possible.

* Si tu as des questions concernant ce fichier, n'hésite pas!

Voilà. Je crois que tu as tout là.

Une nouvelle fois: merci par avance pour ce que tu pourras faire.

Bon début de semaine demain

Cordialement

Zeinebas

PS: le dossier zippé ne passe pas. Je relis le mail où tu me parles du portail d'échange que tu me recommandes et te l'envoie, ok?

@+


Re-bonsoir Banzai64,

Voici le lien Cjoint:

Le dossier y sera pdt 4 jours.

Ca te va?

Bon n'hésite pas à le dire si tu rencontres un souci pour le récupérer, ok?

Bonne soirée/nuit!

Cdlt

Zeinebas

Rechercher des sujets similaires à "comparaison fichiers 2010"