bonjour.
Pour des recherches historiques, j'ai saisi les commerçants des années 1900 de ma ville. Sur 20 ans, de 1890 à 1909, j'ai 12.000 lignes, triées comme suit :
rue, n°, nom du commerçant, année, activité.
Pour une même adresse, un commerçant peut y avoir exercé plusieurs ou une année, et figure donc sur autant de lignes.
Pour rendre le fichier plus lisible car moins lourd, j'envisage qu'un NOM n'occupe qu'une ligne, et les diverses années de sa présence sont détaillées dans les colonnes suivantes, au lieu d'une par ligne.
il faut donc un test du genre :
si le nom du commerçant de la ligne suivante est le même, on prend l'année de cette ligne suivante, et on la colle à la suite de la première ligne.
et on en profite pour détruite la ligne devenue inutile
Si le nom suivant est différent, cela nous fait une nouvelle ligne qui subsistera, et on recommence le test précédent.
voici donc le fichier brut
et un aspect après allègement d'une centaine de lignes (en mode besogneux)
on peut envisager ne mettre en années que la période (date de début - date de fin) c'est encore plus limpide.