Récupération turfostats

Bonjour,

Voilà j'ai trouvé un nouveau site sur le Turf et j'aimerais récupérer les informations.

Le site est turfostats : http://www.turfostats.com

J'aimerais récupérer certaines informations intéressante comme le style de chaque cheval comme en pièce jointe si dessous , la synthèse de chaque course et

les statistiques corde.

turfostats turfostats2

Dis moi si cela est possible et comment faire.

Il y a un login et mot de passe pour avoir toutes les infos complètes

Je débute en récupération via site web.

Merci pour la réponse.

Patron28

Bonjour,

un essai

je ne pense pas qu'il soit possible de passer par une identification par post et enchaîner sur l'interrogation de la page car la gestion de l'identification se fait via cookies

la seule méthode un peu artisanale que j'ai développée est celle-ci

il faut au préalable se loguer avec chrome (et laisser chrome ouvert, c'est mieux mais pas obligatoire). Il suffit d'appuyer sur Go, la récupération des informations est automatique.

edit : suppression de la réponse suite remarque de l'administrateur

Bonjour Steelson,

Merci pour ton travail et le fichier, je vais faire un test pour voir si chez moi cela fonctionne.

Je te tiens au courant.

Patron28

Bonjour Steelson,

J'ai fait un test sur le fichier, je copie bien l'URL, cela m'ouvre une fenêtre internet explorer mais je n'ai aucune récupération de donnée !

Patron28

Internet Explorer est dépassé pour cela. Le mieux est de mettre chrome en navigateur par défaut (ou firefox peut-être), car le problème est de récupérer le code source de la page par view-source:url. Comme dans la vidéo ci-avant.

la seule méthode un peu artisanale que j'ai développée est celle-ci

il faut au préalable se loguer avec chrome (et laisser chrome ouvert, c'est mieux mais pas obligatoire). Il suffit d'appuyer sur Go, la récupération des informations est automatique.

Bonjour,
Je suis l'administrateur et webmaster du site Turfostats.

Je vous remercie pour l'intérêt que vous portez à mon site. Cependant, et malgré sa maigre réputation, voilà un petit moment que le serveur qui héberge mon site subit des pannes temporaires suite à une surcharge de requêtes sur la BDD, me contraignant à modifier constamment l'architecture interne du site depuis un mois.

Je vais faire court.
Les données du site qui sont protégées par inscription n'ont pas vocation à être scrapées pour être stockées et redistribuées. Je m'efforce à créer un outil qui n'existe pas à ce jour et qui me demande beaucoup de travail (non rémunéré) au quotidien entre la mise à jour des données, l'évolution du site et l'animation de la chaîne Twitch qui y est associée. Je n'ai pas de temps à perdre à solliciter mon hébergeur quotidiennement pour remettre mon serveur en place à chaque fois qu'il se voit planté à cause d'une surcharge. Je préfère largement utiliser mon temps dans l'évolution du site que dans la lutte anti-scrapping.

J'ai passé des années de ma vie à essayer de compiler des datas pour trouver la recette miracle du Turf, donc je sais ce que vous faites. Devinez où j'en suis dans mes recherches si j'en suis venu à créer mon propre outil.

La question est simple : Préférez-vous que je passe mon temps à faire évoluer le site et profiter à l'avenir d'un réel outil d'analyse pour les courses hippiques ou bien à jouer au chat et à la souris (qui ne se cache pas très bien au final...) au détriment de l'évolution et la maintenance du site ?

Je vous laisse sur cette réflexion.
Cordialement
Raphaël (Turfostats)

Ma contribution a été supprimée suite à votre légitime remarque.

Si vous souhaitez protéger davantage votre site par des techniques d'ajax/json/contrôle d'IP je suis à votre disposition.

Bonjour,
Je vous remercie pour votre compréhension et pour votre proposition. Je vous recontacterai au besoin si vous le permettez.
J'ai hier banni quelques IPs. Si vous en faites parti et que vous souhaitez utiliser le site dans un but prévu pour, n'hésitez pas à me le dire.

Cordialement
Raphaël

Bonjour à tous,

Même si je ne suis pas intervenu dans ce sujet pour une aide quelconque, en tant que propriétaire d'un site (et d'une boutique) en ligne, je comprends tout à fait ce que ressent turfostats puisque mon site est, et depuis sa mise en ligne qui remonte à 2009, attaqué de toute part (tentative d'injection SQL, PHP, plagiat de contenu, vol de photos) car internet est un lieu d'anarchie permanente... où le libre accès aux informations nous laisse croire facilement que nous pouvons tout y prendre à des fins personnelles.

A quelques semaines d'ouvrir un nouveau site avec une nouvelle activité, j'imagine la tristesse de me faire "dévaliser" numériquement une nouvelle fois, mais malheureusement on ne peut pas tout empêcher.

Je pense que notre site (forum, enfin, ce n'est pas le mien...) n'a pas vocation à encourager ce genre de scraping et qu'à l'avenir les demandes de "connexion / récupération" automatique de données devraient être simplement bannies... C'est mon opinion en tant que propriétaire d'un site internet passionné d'Excel.

C'est une interrogation à mener, me semble-t-il (ou bien peut-être est-elle déjà ajoutée aux conditions d'utilisation du forum sans que nous l'ayons notée).

Bon week-end à tous,

Joe

Bonjour,

Vous avez créé un site sur les paris sur les chevaux.

Pour ma part, j’ai créé un outil qui permet d’avoir l’avantage lors des paris sur les matchs de foot, tennis, etc.

J’ai présenté mon outil sur YouTube en 2 minutes dans une vidéo intitulée « Augustus Gloupe Stratégie 5: Miser sur l'équipe 1 et sur le match nul pour avoir 2 chances sur 3 de gagner mon pari »

N’y connaissant rien aux paris sur les chevaux, ma question est pensez-vous que mon outil puisse aussi être utilisé pour les paris sur les chevaux?

Rechercher des sujets similaires à "recuperation turfostats"