Home >Les Principaux / Articles >Le nouveau Yahoo! Search

Le nouveau Yahoo! Search

Pendant que Google et Ask Jeeves ont depuis longtemps déclaré de vouloir nettement séparer les résultats payants de ceux qui proviennent du calcul algorithmique de leur propre base de données, depuis le premier mars Yahoo!, va dans le sens opposé: en effet, a été annoncée la naissance de Site Match, le nouveau service de liens sponsorisés. Le circuit où les annonceurs auront de la visibilité sera celui d'Altavista, AllTheWeb et justement Yahoo!.

Sur la base de l'article publié sur SearchEngineWatch le 18 février et aux déclarations faites par le Search Engine Strategies de New York, voyons certains des principaux changements que le nouveau système a apporté par rapport à l'indexation d'un site, avec un point de la situation fait en mars 2004.

Avant tout, le nom du robot: Yahoo Slurp. Il est capable de "capturer" la totalité d'un texte dans les documents indexés à concurrence de 500 Kb. Google actuellement s'arrête à 101 Kb. Il cherche également à privilégier les sites qui mettent à jour régulièrement leur contenu, utilisant un Fresh Bot, un logiciel qui suit le principal et contribue à insérer de nouvelles pages dans la base de données deux fois par semaine. La volonté de créer un indexe avec des documents toujours mis à jour fait également suite à la capacité du nouveau moteur à interpréter correctement les éventuels RSS associés à une page contenant des metadonnées au format XML. Afin d'assurer, dès le départ, à la base de données un niveau élevé de contenus, Yahoo à réalisé une collaboration avec National Public RadioOYEZ de la Northwestern University, qui contient plus de 2000 heures d'enregistrement audio de la Court Suprême et avec la Librairie du Congrès, la bibliothèque plus fournie au monde.

Une autre nouveauté est celle de la synergie des sections "Yahoo! E-mail" et "Yahoo! Search" dans le but de combattre le spam. Les deux teams sont entrain de travailler ensemble afin que les données que l'annuaire gère sur les milliards de messages de courrier électronique, puissent donner une aide dans le but de déterminer, et filtrer, tout le matériel "poubelle" qui pourra être identifié dans les documents électroniques. Comme avec Google, Yahoo! apportera de fréquentes modifications à son algorithme faisant ainsi bouger le positionnement des sites.

Les coûts sont de 49$ pour la première URL Les 2 à 10 suivantes coûtent 29$ et dès la onzième le prix est de 10$. L'élément qui aura plus de poids sur le budget des annonceurs sera celui des clicks. En effet est prévu un tarif de 0.15 à 0.30 centimes de $, selon la catégorie. Les annonceurs d'Inktomi, brand qui est entrain de disparaître, ont eu une période de 2 mois afin d'essayer le programme de Yahoo!.

Durant ses différentes interventions effectuées dans des forums publics,Tim Cadogan, vice président de Yahoo! a mis l'accent sur le fait que les insertions payantes ne changeront pas les résultats naturels du moteur. Les pages seront toutes évaluées selon les mêmes paramètres: l'avantage pour les annonceurs est que le spider repasse chaque 48 heures et qu'un canal direct avec la rédaction permettra, probablement, de modifier les sections qui pourraient porter préjudice à un bon positionnement. Un autre aspect qui a été clarifié est celui des conditions nécessaires afin d'apparaître dans l'indexe, il suffit en effet d'être trouvés par le crawler autrement il est nécessaire de faire appel au programme Site Match.

Comment doivent être les pages? Une importance est donnée aux Page Factors. Ils devront donc être soignés, outre au contenu, également les Meta Tag et le Title.
Ont du poids les liens entrant (inbound links) et les mots clés contenus dans l'URL. Les pages dynamiques doivent avoir des liens en provenance de sites statiques et comme toujours, les URL qui ont trop de paramètres seront un obstacle pour le spider, tout comme les javascript qui effectuent des redirections sur d'autres pages, les Frames, les pages satellite, les Session IDs, Search Box et Splash Pages.
D'autres facteurs qui continuent à être utiles pour une indexations correcte sont le fichier Robot.txt, les liens vers la Home Page et la redirection grâce à la "page 301". Ce type de redirection est utile lorsque nous sommes entrain de restructurer notre site en déplaçant certaines de ses pages. Cette technique permet de communiquer au spider la nouvelle URL de cette page sans que ce dernier nous pénalise. Il arrive que les pages 301 aient été indexées à la place des pages de destination, toutefois ce problème est entrain d'être résolu.

Sites no-profit: le premier à faire est celui d'envoyer un e-mail à l'adresse psm@yahoo-inc.com et leur fournir une description de votre site. Une fois examiné, la rédaction vous contactera.

Période d'insertion: à travers l'indexation payantes la période est de 4 jours ouvrables. En passant par la soumission gratuite, (réactivé après de nombreuses plaintes), votre site sera traité après plusieurs semaines. Si le site est inséré dans l'annuaire et respecte les conditions de Yahoo!, il sera visité par le spider après environ 7 semaines.
Geolocalisation: en essayant de rendre plus pertinents les résultats des recherches, Yahoo! tient en compte également les adresses IP des visiteurs. Par exemple, si une recherche est effectuée depuis un état américain pour un voyage en Thailande, les agences de voyage qui seront affichées seront celles situées sur le territoire américain.

Personnalisation des résultats: en utilisant les données obtenues par l'observation de ses visiteurs, Yahoo! propose d'afficher les résultats selon la typologie de visiteur, par exemple pour des jeunes des images pourraient s'afficher à côté du texte afin de rendre les recherches plus interactives et attrayantes, par contre pour des techniciens, au contraire, la partie textuelle, donc la description, sera mise en évidence.
Dimension de la base de données: Yahoo! compte environ 3 milliards de pages. (Chiffre non communiqué)

LesMoteursDeRecherche.com 04/04

Voulez-vous en discuter sur le forum?





Description des plus importants moteurs de recherche
Pages monographiques
Technologie des moteurs
Statistiques et classements
Tableau comparatif
Articles
Interviews exclusives
Newsletter


page précédente Retour en haut de la page