Bonjour,
Ce site est impossible à scrapper par des méthodes traditionnelles. Même si on utilise les urls détaillées suivantes :
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=basic_info&cc=9984
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=summary&cc=9984
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=highlight&cc=9984
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=financial_statement&cc=9984
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=profit_analysis&cc=9984
https://www.kaijinet.com/jpExpress/Default.aspx?f=company&cf=ranking&cc=9984
car tout est appelé en async asynchrone et javascript.
A noter que les deux dernières (proft_analysis et ranking) nécessitent d'être identifié pour accéder aux informations.
La seule possibilité que je vois en ce qui me concerne (j'ai abandonné Selenium car je ne pense pas qu'il sache faire) serait de faire par excel, lancer les url dans chrome et récupérer par copier/coller la page ! Un peu artisanal bien que parfois efficace. L'avantage est que l'identification est préservée.
N'oublie pas que ...
All intellectual property rights relating to information in our database belong to Internet Disclosure, and the providers of the information
Some of our information is provided by the Tokyo Stock Exchange.
Copyright © 2011. Internet Disclosure Co.,Ltd. All Rights Reserved.
donc ... je ne pense pas qu'on puisse t'aider ici.