Hal Varian, ancien professeur d'économie à l'école de sciences de l'information de Berkeley et aujourd'hui Chief economist chez Google a régigé un billet éclairant sur le Blogue officiel de la société, non par les informations qu'il apporte, mais par la clarté du propos. En quelques paragraphes, il brosse une histoire américaine limpide des travaux sur les requètes, pour conclure sur les développements actuels de Google et insister sur l'importance de la collecte des données sur le comportement des utilisateurs. Pour comprendre l'enjeu, il faut se rappeler que les débats sur les données privées sont nourris aux US et que l'UE doit se prononcer justement sur cette question.

Varian Hal, Why data matters, 3/04/2008, Html

Extrait (Trad JMS, avec l'aide de Google, particulièrement performant sur ce texte ;-) :

Au fil des années, Google a continué à investir dans de meilleures fonctionnalités de recherche. Nos experts de la recherche d'information ont ajouté plus de 200 nouveaux critères aux algorithmes qui déterminent la pertinence des sites Web pour la requête d'un utilisateur.

Alors, d'où proviennent donc ces 200 critères supplémentaires ? Quelle est la prochaine étape de la recherche ? Et que nous devons faire pour trouver des informations encore plus pertinentes en ligne ?

Nous ne cessons d'expérimenter notre algorithme, le réglons et le précisons sur une base hebdomadaire pour améliorer la pertinence et l'utilité des résultats pour nos utilisateurs.

Mais pour trouver de nouvelles techniques de classement et évaluer si les utilisateurs trouvent leur bonheur, nous devons stocker et analyser les logs recherche. (Visionnez notre vidéo pour voir exactement quelles données nous conservons dans nos logs.) Sur quels résultats les gens cliquent-ils ? Quelle est le changement de leur comportement lorsque nous changeons des éléments de notre algorithme ? En utilisant des données des logs, nous pouvons comparer la façon dont nous vous faisons trouver l'information utile aujourd'hui par rapport à la façon dont nous le faisions il y a un an. Si nous ne gardons pas un historique, nous ne pouvons évaluer nos progrès et proposer des améliorations.

Pour choisir un exemple simple : le correcteur orthographique de Google est basée sur notre analyse des recherches de l'utilisateur compilées à partir de nos logs - et pas sur un dictionnaire. De même, nous avons eu beaucoup de succès en utilisant des requêtes de données pour améliorer nos informations sur les lieux géographiques, ce qui nous permet de fournir une meilleure recherche locale.

Repéré par D. Durand