Chercher dans les moteurs de recherche a toujours été synonyme de résultats contenant des milliers de documents, classés selon l'importance des termes inclus dans notre requête, mesurés selon de nombreux paramètres liés à la présence et à la position de mots clés dans la page web.
La plupart des technologies utilisées par les moteurs de recherche que nous connaissons et utilisons fréquemment fait appel également aux liens de et vers une page web (Inbound et Outbound link), afin d'évaluer l'importance et déterminer le positionnement de la page par rapport à un certain mot clé.
Savoir comment les moteurs de recherche considèrent les liens entre les pages Internet est donc important pour les connaître un peu plus et comprendre toujours mieux les motifs qui "bougent" nos pages à l'intérieur de leurs bases de données.
Dans cet article nous ferons référence également à des déclarations de représentants de Google, FAST et AskJeeves/Teoma dans la Search Engine Strategies Conference de Boston (Mars 2002) et au whitepaper que Wisenut met à disposition sur son site.
A l'origine, à la base de tout, il y à eu le problème/objectif de réussir à utiliser un paramètre "humain" afin de déterminer combien était importante une page par rapport aux autres selon un mot clé défini. Mais comment faire cela sans devoir impliquer (et donc payer) un grand nombre de personnes et étudier un système valable pour leur permettre de donner des évaluations "objectives"? La seule façon était de créer un système mathématique centré sur l'évaluation (souvent pas expressément reconnue) d'un site de la part d'autres responsables, administrateurs et créateurs de sites web. En résumé, le système devait pouvoir répondre à la question "Que pensent les autres de mon site? L'évaluent-ils importants et intéressant par rapport à un certain argument?".
Google semble avoir être le pionnier dans l'utilisation des liens hypertextes pour la création d'un système d'évaluation de l'importance d'un site web.
Grâce à la technologie appelée PageRank, Google réussit aujourd'hui à fournir des résultats hautement pertinents en établissant d'une façon complètement automatique une mesure objective de l'importance de chaque page présente dans son database. PageRank utilise une équation d'environ 500 millions de variables et 2 milliards de mots clés pour créer une structure des liens d'Internet qu'il utilise par la suite comme instrument d'organisation et évalutation. Ce système n'exécute pas simplement un comptage des liens vers notre site présents dans les pages par lui indexées (c'est à dire la Link Popularity: exemple avec LesMoteursdeRecherche.com) et un comptage des liens de notre site vers ces mêmes pages, mais évalue également la provenance et donc la "qualité" des liens ou encore mieux la pertinence par rapport à l'argument traité dans notre page.
Afin de pouvoir une idée de notre PageRank et de façon plus générale celui du réseau de liens qui gravites autour de notre site, il est nécessaire de télécharger la Google Toolbar. Il est également utile d'interroger d'autres moteurs pour savoir combien de liens vers nos pages sont présents dans leurs bases de données.
Pensons à Yahoo!: il a sûrement un énorme nombre de liens sur tout Internet et plusieurs d'entre eux sont probablement des sites scientifiques, toutefois on ne peut pas dire qu'il est le site plus reconnus et pertinent par rapport au mot clé "physique quantique".
Cherchons à mieux comprendre cet outil: Google interprète un lien de la page A à la page B comme un vote de A pour B et si à son tour aussi B a un lien vers A tous les deux reçoivent un vote encore plus haut (Feedback-Link).
Si la page B a un PageRank plus haut, la valeur de son lien est encore plus élevée, mais si elle a une valeur plus basse il n'existe aucune pénalité.
L'importance d'une page est donnée par le vote que celle-ci reçoit "par le Web" dans sa globalité et les liens internes à notre site déterminent le PageRank des pages internes.
En effet, si les liens que nous obtenons de l'extérieur sont dirigés vers l'Home Page celle-ci aura une valeur plus élevée et les pages de notre site directement reliées à elle (par exemple celles des sections principales du site) auront une valeur de PageRank immédiatement inférieure, mais supérieure à celles qui ne sont pas "liées".
LesMoteursDeRecherche.com 11/02
Description des plus importants moteurs de recherche
Pages monographiques
Technologie des moteurs
Statistiques et classements
Tableau comparatif
Articles
Interviews exclusives
Newsletter