Des bénéfices deux ans à peine après sa création, alors que la publicité en ligne était déjà en plein marasme. Une extraordinaire notoriété, sans un centime dépensé en communication. Une non moins mirobolante image auprès des surfeurs, au point que certains parlent de " googlemania "… Née en 1999, à l'université de Stanford, en Californie, Google est un cas atypique parmi les moteurs de recherche. Son succès ? " Il tient en deux mots : simplicité d'utilisation et pertinence des classements, explique Randolf Hock, professeur à l'université du Maryland et grand spécialiste de la question. Des classements fondés sur une juste évaluation de la fréquentation des sites, premier garant de leur intérêt et de leur qualité."
Avec un chiffre d'affaires estimé à plus de 250 millions de dollars déjà (les sociétés américaines dites " privées ", c'est-à-dire non cotées, ne publient généralement pas leurs résultats), l'entreprise vise la Bourse cette année. Pour convaincre les investisseurs échaudés par Internet, elle doit tout à la fois conforter son avance technologique et diversifier ses sources de revenus. " Quel que soit sa performance actuelle, aucun moteur de recherche n'est aujourd'hui sûr d'être encore là demain ", souligne le consultant américain Danny Sullivan, éditeur de la lettre spécialisée SearchEngine Watch. Depuis 1996, plusieurs moteurs ont cessé leur activité. C'est le cas d'OpenText, de Magellan, de Cyber 411… D'autres ont été repris par de plus gros. Ainsi Webcrawler a été absorbé par Excite, Point par Lycos, etc. Certains, tels AOL, MSN et Yahoo, sont devenus de gros portails généralistes, une évolution qui a un temps masqué une concentration inéluctable, à nouveau à l'ordre du jour depuis la débâcle des " dot.com ". Très dépendant de la publicité en ligne, Go a carrément mis la clé sous la porte. AltaVista, Excite, LookSmart et d'autres ont dû dégraisser leurs effectifs et adapter leur modèle économique au nouveau contexte.
PERTINENCE DES CLASSEMENTS PROPOSES, SIMPLICITE, LES INTERNAUTES APPLAUDISSENT
Nouveaux Gourous:Sergei Brin et Larry Page (à g.), cofondateurs de Google. Ils font partie de la relève des Bill Gates (MSN) et autres Steve Jobs (Apple), les pionniers de l'informatique grand public.
|
Deux acteurs tirent cependant leur épingle du jeu : Google… et Overture. Coté en Bourse et ayant réalisé un chiffre d'affaires de 172 millions de dollars en 2001, ce dernier a pris la profession à contre-pied en imposant un modèle basé sur le référencement payant : les sites sont présents dans la base d'Overture - sur un certain nombre de critères de recherche - moyennant espèces sonnantes et trébuchantes. " Un moteur de recherche publicitaire sur Internet ", résume Danny Sullivan. C'est la croissance aussi fulgurante qu'inattendue de ce modèle - il compte 53 000 annonceurs payant en moyenne 0,23 dollar du clic - qui pousse Google à infléchir quelque peu sa propre approche économique. " Inévitable, poursuit Danny Sullivan, il faut bien compenser la chute de la publicité en ligne. " Reste qu'Overture devra confirmer sa cote d'amour à la Bourse. Ce que rien ne permet de prédire avec certitude : le titre est surévalué, estiment plusieurs analystes financiers.
Concurrence oblige, Google, dont les commandes ont été confiées à Eric Schmidt, ex-patron de Novell, a décidé de ne pas s'endormir sur ses lauriers. Et de profiter pour cela des qualités de visionnaire de son nouveau patron : " C'est rare, un manager qui maîtrise aussi bien la technologie ", estime le fondateur Larry Page. Depuis peu, Google passe pour le plus fréquenté des moteurs de recherche. Jusque-là, les études de Nielsen/NetRatings le classaient assez loin derrière Yahoo, Lycos et Excite. En octobre 2001, Yahoo était crédité de 68,4 millions de visites mensuelles, contre 39,5 pour Lycos, 21,7 pour Excite et 21,1 pour Google. Mais ces statistiques ne comptabilisaient que le trafic. En clair : elles ne différenciaient pas une vraie recherche d'une simple consultation sur un portail.
Ce qui a poussé le cabinet concurrent Jupiter Media Metrix à y regarder de plus près. Il publiait en janvier 2002 ses propres estimations sur le trafic réel engendré par les recherches. Google y apparaît en troisième position (voir graphique), derrière MSN et Yahoo. Plus proches de la réalité, les statistiques de Jupiter Media Metrix oublient cependant Lycos, dont le poids est estimé à 19 %. La première place attribuée au site Microsoft - très contestée dans la profession - est liée à l'effet Internet Explorer : le navigateur de l'éditeur contient une fonction de recherche qui fausserait les statistiques. Bien que différentes dans leur approche, les deux études s'accordent sur un point : la part de Google en matière de recherches connaît la plus forte croissance du secteur.
La notoriété comme l'image du site tiennent à la puissance et à la pertinence de la technologie Page Rank, mise au point par les deux fondateurs de Google, Larry Page et Sergei Brin, alors qu'ils étaient étudiants en informatique à Stanford, et qui a fait l'objet de plusieurs dépôts de brevets. " La qualité des résultats de recherche est quasiment inégalée, estime Fulvio Di Stefano, directeur d'Internet Diffusion, la société qui anime le site Les moteursderecherche.com. Sa rapidité n'est pas moins bonne, sans oublier le graphisme simple et léger du site. " L'importance de chaque page par rapport à une question donnée est évaluée grâce à des algorithmes sophistiqués intégrant plus de 500 millions de variables et deux milliards de termes. Le temps moyen d'une requête est de l'ordre de 0,29 seconde.
Dans 20 % à 30 % des requêtes, Google affiche en parallèle des résultats une liste de " sites partenaires " ayant payé pour figurer, avec les résultats de certaines recherches sous la forme d'insertions de textes promotionnels. Un modèle auquel Larry Page tient beaucoup : " Contrairement à nos concurrents, nous avons fait le choix de ne pas utiliser de bandeaux graphiques pour la publicité, mais uniquement du texte, et de ne jamais privilégier la page d'un client sur la page de résultats de la recherche. Les textes publicitaires sont bien séparés du reste des résultats. " Aujourd'hui, ces annonces textuelles en ligne constituent la moitié du chiffre d'affaires de la société, le reste provenant de la vente sous licence de la technologie Page Rank.
Décidé à creuser le fossé avec ses concurrents, Google a élargi la palette de ses requêtes, en prenant en compte d'autres formats de documents que l'HTML : aux pages du Web s'ajoutent en effet les documents aux formats .pdf (lisibles sous Acrobat Reader), les documents issus du logiciel Office de Microsoft (tableaux .xls, présentations .ppt et textes en .doc ou .rtf), ainsi que les documents des forums (web usenet). Par ailleurs, la société a ouvert un nouveau site dédié à la recherche d'images sur le Net. Ses résultats sont pertinents. Il fonctionne, en anglais et en français, grâce à la combinaison de trois critères de requête : le nom du fichier image (exemple : lapin.jpg), le texte des pages Web contenant des photos et l'adresse d'un site (exemple : lapin.com). Seule condition, le mot recherché doit figurer au minimum quelque part, car le moteur n'est pas capable d'analyser une image et d'en déduire tout seul qu'il s'agit d'un lapin. La page de résultats apparaît sous la forme d'une planche-contact présentant les photos en taille réduite, le nom des fichiers et leur taille en pixels et en octets. À terme, l'objectif de Google est d'indexer tout le Web mais aussi d'aller au-delà, avec " la création de Google Groups, qui indexe les messages des groupes de discussion Internet ou encore d'un service de traduction. " La société travaille en outre avec l'allemand BMW sur une technologie qui permettra de lancer des recherches sur des documents vocaux.
Malgré son avance technologique et le succès de son modèle, Google a été poussé par la fulgurante ascension d'Overture à infléchir sa politique de facturation vis-à-vis des annonceurs de publicité textuelle. Le moteur de recherche conserve toujours ses offres AdWord (8 à 15 dollars pour mille impressions), mais y a ajouté AdWord Premium, pour un placement en haut de l'écran, et AdWord Select, savant dosage entre l'efficacité de la publicité pour l'annonceur et la pertinence des bandeaux de texte pour l'internaute. En d'autres termes, les annonceurs ne paieront qu'en fonction du nombre de clics sur leurs textes. Un algorithme complexe définit la position du texte publicitaire dans la page, en fonction du prix payé par clic et de la popularité de la publicité. Cette dernière résulte du rapport entre le nombre d'impressions et le nombre de clics.
Quant au prix du clic, il est défini par un système d'enchères. L'annonceur choisit en effet le prix maximal qu'il est prêt à payer pour chaque clic. Le système compare alors ce prix avec celui d'annonceurs en concurrence pour le même mot-clé. De cette savante confrontation découle la position finale du texte publicitaire dans la page. Si une publicité recueille moins de 5 clics pour 1 000 impressions, le texte est purement et simplement retiré du système. " Ce procédé permet d'améliorer pour l'internaute la pertinence des messages publicitaires affichés pour chaque mot-clé ", explique-t-on du côté de Google.
Par ailleurs, la société propose désormais sa technologie Page Rank aux entreprises qui souhaitent offrir des fonctions de recherche sur leurs propres sites. L'enjeu est de taille : le marché est estimé à un milliard de dollars par an. Mais il est solidement tenu par deux leaders, Inktomi et Verity. Malgré des références prestigieuses comme celles de Cisco, Sony ou Procter & Gamble, la société est encore très loin de pouvoir rivaliser avec elles. Inktomi et Verity comptent respectivement 2 500 et 1 800 clients… contre une centaine pour Google. Les deux leaders licencient la technologie de leur moteur, alors que Google, opposé au principe, offre un service en ligne dont il reste entièrement maître, ce qui va à l'encontre de bien des politiques de sécurité mises en place dans certaines entreprises. Pourtant, la location annuelle du service permet de faire l'économie des serveurs et des équipes nécessaires pour exploiter en interne un moteur de recherche. Reste à en convaincre les directions informatiques ! C'est l'une des priorités que s'est fixées Eric Shmidt, conscient de l'impérieuse nécessité de diversifier les sources de revenus de la société.
Quid de l'Europe ? Fulvio Di Stefano, d'Internet Diffusion, fait remarquer que " la moitié des requêtes sont faites hors des États-Unis. Google est fortement utilisé sur le Vieux Continent. En revanche, il est vrai que l'entreprise n'y est pas encore présente commercialement de façon active. Mais ce n'est qu'une question de temps. " L'entreprise viendra-t-elle au seul référencement payant ? Nombreux sont ceux qui estiment, avec le Pr Randolf Hock, " qu'il va devenir de plus en plus courant, puisqu'il s'opère d'une manière acceptable pour l'utilisateur ". " Je ne crois pas à un changement radical de modèle économique ", répond Fulvio Di Stefano. Surtout que ledit modèle a fait ses preuves !
De colossales archives d'index
Les moteurs de recherche sont indispensables lorsque l'on va à la pêche aux informations sur Internet. Ce sont d'énormes archives de données contenant, sous forme d'index, des informations détaillées sur des millions de pages du Web. Les pages qui composent un site donné sont ainsi mémorisées individuellement, ce qui explique qu'un site puisse être mentionné plusieurs fois lors d'une requête. L'ajout de pages dans les archives se fait soit manuellement par le responsable du moteur, soit automatiquement grâce à un logiciel qui scrute quotidiennement des millions de sites afin de détecter et de référencer les nouvelles pages. Cependant, malgré l'automatisation, il est quasiment impossible de répertorier tout le Web.
Un moteur de recherche mémorise l'essentiel du contenu des pages recensées. Soumis à une requête, il présente une liste de pages contenant les mots ou les phrases recherchés. Cette étape des mots-clés est déterminante. Malgré la pertinence des mots-clés, un moteur peut lister des pages sans rapport avec la recherche. Mais, avec la pratique, l'efficacité augmente. Les bonnes pages, mais également les newsgroups, ainsi que les débats publics sur un sujet donné sont facilement trouvées.
130 millions de requêtes par jour
Chaque jour, plus de 1,5 million de nouvelles pages sont ajoutées à la base de Google. Le cap du milliard de pages référencées a été passé en juin 2000. Aujourd'hui, la base compte plus de 1 600 millions de pages, un chiffre qui place Google loin devant Altavista (500 millions), Lycos (340 millions) ou Excite (250 millions). " De gros efforts ont été faits dans la plupart des moteurs de recherche pour accroître les capacités d'indexation, reconnaît Danny Sullivan, éditeur de la lettre SearchEngine Watch. Mais il reste beaucoup à faire pour améliorer la pertinence des résultats. " Si l'on se fie aux nombre de requêtes traitées quotidiennement par Google - aux alentours de 130 millions par jour - on peut cependant dire que les internautes sont globalement satisfaits des résultats qu'ils obtiennent.
Jo Cohen, Economia 07/02
Abonnez-vous à Economia, 25% de réduction!
Description des plus importants moteurs de recherche
Pages monographiques
Technologie des moteurs
Statistiques et classements
Tableau comparatif
Articles
Interviews exclusives
Newsletter