Paragraphe dans document HTML

Bonjour à tous

Je voudrais extraire les paragraphes d'une site en essayant le code suivant mais j'y arrive pas après plusieurs essais infructueux.

ci voici un exemple de code que j'ai testé :

Private Sub BrowseWiseowl()

Dim oXMLPage As Object
Dim aHTML As Object
Dim sURL As String
Dim tagName As String

Dim div As MSHTML.IHTMLElementCollection
Dim ptext As MSHTML.IHTMLElement

Set oXMLPage = CreateObject("MSXML2.ServerXMLHTTP")
Set aHTML = CreateObject("htmlfile")

sURL = "http://www.readersdigest.ca/health/conditions/6-ways-soothe-foot-pain/view-all/"

oXMLPage.Open "GET", sURL, False
oXMLPage.send

aHTML.body.innerHTML = oXMLPage.responseText
Set oXMLPage = Nothing

Set div = aHTML.getElementsByTagName("div")

For Each ptext In div
If ptext.tagName = "p" Then
Debug.Print ptext.innerText
End If
Next ptext

End Sub

J'ai mis en pj les réference que j'utilise et une capture du paragraphe et titre à extraire.

Merci.

Cdt.

reference 2017 12 01 excel forum 2017 12 01

bonjour,

une adaptation de ton code

Private Sub BrowseWiseowl()

    Dim oXMLPage As Object
    Dim aHTML As Object
    Dim sURL As String
    Dim tagName As String

    Dim div As Object
    Dim ptext As Object

    Set oXMLPage = CreateObject("MSXML2.ServerXMLHTTP")
    Set aHTML = CreateObject("htmlfile")

    sURL = "http://www.readersdigest.ca/health/conditions/6-ways-soothe-foot-pain/view-all/"

    oXMLPage.Open "GET", sURL, False
    oXMLPage.send

    aHTML.body.innerHTML = oXMLPage.responseText
    Set oXMLPage = Nothing

    Set div = aHTML.getelementsbytagname("div")

    For Each ptext In div
        For Each p In ptext.getelementsbytagname("p")
            Debug.Print p.innerText
        Next p
    Next ptext

End Sub

Merci bien h2so4, je vais essayer ton code!


ça semble marcher la première fois mais quand j’essaie une deuxième, cela fait apparaitre un message d'erreur : "erreur 13"


"erreur 91" plutot pardon


La je dois partir mais je reviens sur ta réponse la semaine prochaine. bonne continuation et merci

Bonjour,

je n'ai pas de problème avec des exécutions successives du code que j'ai fourni. L'as-tu modifié ?

Bjr h2So4

je m'excuse pour le retard de la réponse. en fait j'ai remplacé debug.print par activesheet.range("A1") mais ça marche.

Merci c'est résolu. Il me reste à trouver les bonnes paragraphes si j'y arrive.

cdt.

Rechercher des sujets similaires à "paragraphe document html"