« Paie Ton Patch !™ » : Weboob – Partie 2/2

5.3 pages.py

C’est le gros du boulot puisque ces classes vont rechercher les éléments utiles dans le contenu de la page. Ce sont celles que l’on doit patcher lorsqu’un webmaster a un accès de créativité. Heureusement, cette tâche s’est considérablement simplifiée depuis Browser2.

Lire la suite

« Paie Ton Patch !™ » : Weboob – Partie 1/2

Combien de fois vous êtes-vous dit « Pourquoi c’est pas corrigé ça ? » ou « faudrait patcher ce truc » sans oser le faire ? Voici une occasion !

Web Outside of Browsers [1] est un ensemble d’outils modulaires en ligne de commandes écrits en Python, ainsi que quelques applications graphiques Qt. Son but est de pouvoir utiliser des sites web comme l’on utilise d’autres ressources sous Unix, à l’aide d’outils simples composables et scriptables. Parmi les outils de scraping existants, il s’agit probablement du plus complet, et décrire ses possibilités nécessiterait plusieurs articles. Ses compétences vont de la récupération de vidéos de sites web (et non-web en Flash) à l’émission de virements bancaires, en passant par l’édition de tickets dans un bugtracker, ou la recherche d’emploi. C’est cette dernière fonction que nous testerons, en contribuant au support du site LinuxJobs.fr [2].

Lire la suite