jan 12
24
Moteur Orange: scrapper et récupérer les backlinks
Lemoteur.fr étant le moteur de recherche interne de l’opérateur historique Orange…
… Je me suis décidé à réaliser un petit script de récupération des backlinks issus de cette plateforme.
La méthodologie est plutôt simple, puisqu’il suffit de se balader dans les pages de résultats avec les paramètres « ap » & « apaskmond ».
Ensuite, il suffit de sélectionner le chemin direct des liens via XPath (Crédit à @beunwa pour sa fonction GetDomValue):
/html/body/div[3]/div[3]/div/p/a[3]
Il ne reste plus qu’à extraire les URLs ![]()
Télécharger le script « Backlinks Orange »
Usage: orange.php?url=%votre_url% (exemple: orange.php?url=tf1.fr / orange.php?url=orange.fr) ==> pas de http://www.
puis dans le source:
$orange = new Orange();
$orange->getBacklinks($_GET['url']);
$orange->displayBacklinks();
Enfin, à noter, le fail des équipes d’Orange, avec la duplication de http://www.lemoteur.fr/ avec http://search.ke.voila.fr/:
Cheers.


