Récupérer les href entre balise <span> sur google sheets

Bonjour,

je procède à un IMPORTXML sur un site de vente je sélectionne le titre des produits qui me donnent l'url cible du produits, cependant dans la construction html je me retrouve avec des balise différente soit une Balise <a> soit <span> pour les produits

avec les balise <a> xpath (//*[@id="content"]/div[2]/div[6]/div/ul/li[1]/div/div[3]/div[1]/a/@href) je récupère url cible

avec les balises <span> (//*[@id="content"]/div[2]/div[6]/div/ul/li[2]/div/div[3]/div[1]/span[1]/@href)je ne récupère pas l'url cible

comment puis je récupérer les urls derrière un span;

merci.

Bonjour, et bienvenue

pour récupérer l'url, tu peux faire appel à la fonction REGEXEXTRACT ... mais pour définir l'expression régulière il serait intéressant de savoir exactement quelle donnée tu récupères, sa syntaxe, son orthographe

quoique je ne suis pas certain de bien comprendre ton besoin car derrière un span tu n'as pas normalement d'attributs de type href !!

peux-tu nous donner plus d'informations sur le site notamment ?

je fait suivre le bout de code HTML

entre a

image

Entre span

image

c'est url ici que je souhaite récupérer

la solution est simple merci pour ta reponse en effet ce n'est pas /@href mais /@url que je dois mettre

merci pour le retour

en effet !

je pense que pour ton xpath, il y a beaucoup plus simple, genre

//span[@data_ga_label='lkw_category_car_list']/@url

mais comme tu m'as gratifié d'images, je ne peux pas en faire grand chose !

il m'interdis les liens comme je suis tout neuf sur le forum

Normalement les liens vers un fichier GSheets te sont autorisés.

Sinon, utilise la balise </> que tu trouves dans le cartouche haut des réponses ou remplace les points par un espace dans ton url

https://docs.google.com/spreadsheets/d/1FtYS2ezuVcULo-eBdv0_eHtRtCu1lXGt4rp2nNGYDmA/edit?usp=sharing

voici le lin vers un de mes fichiers google sheets

par contre on ne peux pas faire plus de 50 urls a la fois sinon sa plante?

Accès refusé

image

Je suis un peu perdu ... car je ne sais pas quelle url tu veux récupérer; j'en trouve plusieurs comme ici

https://docs.google.com/spreadsheets/d/1Pi-wNwjZ0lmqE8rk5-SJGt9f64lQBNiyQSoUQTcoQVw/edit?usp=sharing

et je n'ai pas tout détaillé pour tenter de trouver un cas avec span (si tu pouvais m'en indiquer un)

image

Tu peux être bloqué soit par google au bout de 6 minutes de traitement par le serveur, par le site qui bloque ton IP car elle considère que c'es du scrapping

capture d ecran 898

En faite je veux les récupérer toutes

donc voilà, prends la Feuille2

si tu les veux sans réserver de lignes intermédiaires, fais en Feuille 3

=transpose(importxml(A2;B$1))

note que ...

image

tu utilises Transpose?

merci tu me conseil de le faire avec combien d'adresse urls maximum;

encore merci pour ton retour c'est super cool

ce sera toujours compliqué, car à chaque fois que tu ouvriras ton fichier, google referra l'importation !

l'autre solution serait de passer par un script, ce qui permettrait de "piloter" l'import

ok je me penche sur le script

merci encore

Rechercher des sujets similaires à "recuperer href entre balise span google sheets"