Bonjour
j'ai une petite question dans laquelle je pédale un peu.
Je dois contrôler un ensemble de données textes dans une colonne où elles sont rassemblées les unes derrière les autres séparées par un repère clair de leur nature;
Voici le contenu de la colonne de mon fichier, pour un article donné, regroupant les caractéristiques différentes d'un produit, toujours avec les mêmes séparateurs:
Conditionnement: T[Verrine]; Région: S[Aquitaine]; DLUO: T[36 m]; Code douane: T[21039090]; Composition: T[Mangue* (60 %), sucre de canne*, jus concentré de citron*, gélifiant : pectine de fruits. * Produits issus de l’Agriculture Biologique - Allergènes: -]; Marque: E[SAVEURS ATTITUDES]; Valeurs nutritionnelles: T[Energie (kCal/100g): 224 - Matière grasse/Acides gras (g/100g): 0,2/0,1 - Glucides/Sucres (g/100g): 55,2/54,5 - Protéïnes (g/100g): 0,5 - Sel (g/100g): 0,0036 - Fibres (g/100g): 1,1]; Poids: O[220]
J'ai besoin d'extraire de chacune de ces lignes de chaque cellule de mon fichier, pr exemple tous les conditionnements de mes produits; ici "Verrine"
Ce mot démarre, derrière Conditionnement, toujours à "dernier caractère + 5 ou à +1 après Conditionnement: [
"Conditionnement: [ " + 1 est la position du premier caractère recherché.
MAIS je ne connais pas sa longueur; donc je dois repérer la fin de la zone ou il se trouve qui est forcément définie à 4 caractères DEVANT le R de Région (Région - 4 est la position du dernier caractère de mon mot que je cherche.
Enfin, je dois donc reconstituer le "texte" qui est défini entre ces deux positions.
Donc je dois chercher les mots Conditionnement et Région, Composition et Allergènes, Allergènes et Marque, Valeurs nutritionnelles et Poids, pour extraire mes 4 données:
> le conditionnement
> la composition
> les allergènes (ici il n'y en a pas)
> les valeurs nutritionnelles, la donnée de fin étant Poids
Je n'arrive pas à l'écrire, qqn a une idée simple et rusée ?
Toutes les séquences des données en gras sont les mêmes, ds le même ordre bien sûr.