Discussion:
Parser les resultats de moteurs de rech erche
(trop ancien pour répondre)
Olivier Masson
2007-04-09 20:03:18 UTC
Permalink
Bonjour,

pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?

Le but est d'avoir de vrais résultats : ceux de l'API Google - j'ai une
clé :) - sont connus pour être parfois très différents de ceux du moteur
de recherche et ceux de Yahoo pas parfait non plus. Et cela permettrait
d'étendre le procédé à d'autres moteurs.

J'ai pensé bêtement utiliser fopen ou curl_exec et cherche dans le
contenu un motif qui me permette de trouver les url.
Par exemple Google a toujours
<div class=g>
<!--m-->
<h2 class=r>
avant l'url trouvé.
Si ça change soudainement, on le verra dans les résultats.

Merci.
Vincent Lascaux
2007-04-10 05:20:21 UTC
Permalink
Post by Olivier Masson
pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?
Oui, mais je ne pense pas que ce soit légal
--
Vincent
Denis Beauregard
2007-04-10 06:25:05 UTC
Permalink
Le 10 Apr 2007 05:20:21 GMT, Vincent Lascaux
Post by Vincent Lascaux
Post by Olivier Masson
pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?
Oui, mais je ne pense pas que ce soit légal
Pourtant, il me semble que je suis tombé sur un site qui utilisait
l'API de Google pour donner les résultats avec le page rank et un
autre qui donnait le position d'un site parmi les 100 premiers
résultats d'une requête google.

Je n'ai pas noté les adresses de ces sites et ce n'est plus dans
l'historique de mon navigateur mais on devrait les retrouver
facilement.

Avec une recherche rapide:

http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.

http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.

Donc, le procédé me semble légal.


Denis
Vincent Lascaux
2007-04-10 14:04:56 UTC
Permalink
Post by Denis Beauregard
http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.
http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.
C'est pas parceque quelqu'un fait quelque chose que c'est légal

http://www.google.fr/accounts/TOS semble confirmer que c'est illégal :

Google est réservé à un usage personnel

Les Services de recherche Google sont mis à votre disposition
exclusivement pour un usage personnel et non commercial. Vous ne devez
pas utiliser les Services de recherche Google pour vendre des produits
ou des services, ni en vue d'augmenter le trafic de votre site Web
pour des motifs commerciaux (ventes, promotion, publicité, etc.). Vous
ne devez en aucun cas réutiliser les résultats des recherches Google
par reformatage et affichage, ni reproduire la page d'accueil de
Google ou les pages de résultats sur votre site Web. [...]

Les requêtes automatisées sont interdites

Vous ne devez pas transmettre de requêtes automatisées d'aucune sorte
aux systèmes de Google sans autorisation explicite et préalable de
Google. Par « requêtes automatisées », nous entendons également
l'utilisation de tout logiciel qui transmet des requêtes à Google pour
déterminer le « rang » obtenu par un site Web dans les index Google en
fonction de différents termes de recherche.
--
Vincent
Olivier Masson
2007-04-10 17:16:50 UTC
Permalink
Post by Vincent Lascaux
Oui, mais je ne pense pas que ce soit légal
Ca, c'est un autre problème. Mais avec le peu de requêtes que je compte
faire, aucun risque d'être vu.
C'est un peu à l'image des 15 centimes que Google à rembourser à un de
mes clients pour clics fraduleux dans Adwords : ils se foutent
royalement des petites gens. Donc tout va bien :)
michel
2007-04-10 14:04:56 UTC
Permalink
Pour info, je viens tout juste de voir passer ça:
http://www.phpclasses.org/browse/package/3816.html

michel
Olivier Masson
2007-04-10 17:16:50 UTC
Permalink
Post by michel
http://www.phpclasses.org/browse/package/3816.html
michel
Merci, je vais voir s'il y a une idée géniale dedans.

Continuer la lecture sur narkive:
Loading...