Archive pour février 2007

MS essaye de se refaire une santé dans le search.

Mercredi 28 février 2007

Un grand de la recherche généraliste qui se lance dans la recherche verticale, c’est suffisamment rare pour être souligné.

Microsoft vient de racheter le moteur américain spécialisé dans le domaine de la santé - MedStory.

Même si le marché de la santé a le vent en poupe, je fais partie de ceux qui pensent qu’il existe une place pour les moteurs de recherche spécialisés par domaine.

En effet les grands généralistes ne peuvent pas couvrir tous les domaines avec le même type d’algorithme, la même interface et penser que cela peut se faire sans aucune intervention humaine. Mais j’aurais l’occasion d’y revenir.

Rien que pour vos yeux.

Lundi 26 février 2007

Une étude intéressante vient de sortir : “Visual attention to online search engine“. Comme son nom l’indique il s’agit de suivre les yeux d’un internaute pendant sa recherche sur un moteur.

eyetrackingforsearch2.jpg

L’étude essaye de différencier deux profils :

  • une simple recherche d’informations
  • une recherche pour un achat de produit

La différence entre ces deux profils n’est pas flagrante et les comportements sont assez similaires.

Par contre la lecture des résultats organiques et celle des liens sponsorisés confirme la tendance générale. En gros, seul le tiers des utilisateurs prend connaissance de la colonne de droite.

eyetrackingforsearch.jpg

Le “eyetracking” (oculométrie en français) est vraiment une techno formidable d’analyse qui semble arrivée à maturité. Je rêverais de l’utiliser pour nos projets de search en cours, mais cela ne rentre pas encore dans notre budget ;-)

SearchMash le futur Google 2.0 ?

Vendredi 23 février 2007

L’article de Ayson nous rappelle l’expérimentation de Google autour des interfaces de son moteur de recherche via son site : SearchMash.

Cela fait un peu mode 2.0 :

- Demande de l’avis des internautes sur les nouvelles fonctionnalités possibles.

- Un peu d’Ajax pour faire comme si.

searchmpash.jpg

Par contre la catégorisation qui apparait dans certains cas sous forme d’onglets, pourrait être un excellent moyen de “désambigüiser” la requête. Mais en y regardant d’un peu plus près cela se rapproche plus du concept de clusterisation comme le fait, depuis longtemps, le moteur Clusty. Voir pour exemple les similitudes sur la requête Beatles sur SearchMash & Beatles sur Clusty

Je me passionne pour la navigation dans les moteurs de recherche afin de faciliter la vie des visiteurs. Il semble que dans ce domaine l’innovation soit difficile.

Par contre j’ai beaucoup aimé des petites choses comme la saisie de la requête même si le curseur n’est pas dans le champ adéquat (start typing). Je trouve cela très pratique.

Bref rien de bien révolutionnaire, mais après tout ce n’est qu’une plate forme de tests. Google peut se permettre de garder en stock les vraies innovations pour ne les sortir que lorsque la concurrence aura avancé, et ce n’est pas pour tout de suite.

Les ânes se chaussent en Prada

Vendredi 16 février 2007

Comme dans la haute-couture et ses deux collections par an, nos ânes ont besoin de deux interventions annuelles du maréchal ferrant.

marechal-ferrant.jpg

Ils ne sont pas ferrés car ils vivent uniquement dans les champs, mais il faut tout de même les parer (couper les ongles) et vérifier les problèmes éventuels comme des fourmilières ou des soucis de fourchette.

Je sais c’est pas trop web 2.0, mais cela fait aussi partie de ma vie.

L’Arthus Bertrand du shopping

Mardi 13 février 2007

Sortie d’un nouveau site de e-commerce vu dans comparison engines, avec une navigation assez particulière.

Son nom est déjà tout un programme : Browsegoods

browsegoods.jpg

Imaginez Google-Map, où la carte serait remplacée par un immense montage photos de tous les produits disponibles à la vente. Rajoutez une fonction de zoom directement à la souris et vous aurez une des plus grandes vitrines du monde, organisée par catégories et par marques
. Vous pouvez ainsi fondre directement sur cette merveilleuse paire de tongs roses fluo. En cliquant sur la proie vous obtenez des détails complémentaires et la possibilité de passer la commande.

J’espère qu’ils possèdent un système automatique de gestion de la carte en fonction des nouveaux produits et de suppression des anciens.

C’est une expérience intéressante et vraiment ludique. Mais je ne suis pas certain que ce type de navigation améliore les ventes.

XEROX parle aux moteurs

Lundi 12 février 2007

Xerox vient d’annoncer un partenariat avec Powerset pour la recherche en langage naturel, vu dans un article de Yves Grandmontagne.

On est ici un peu dans la recherche du “Saint Graal”, ou comment “parler” au moteur pour qu’il me comprenne.

Ce type de technologie demande en amont une grande connaissance de la langue (dictionnaire, règles de grammaire, …). Le travail à fournir est colossal.

xerox2.jpg

Outre le mythique PARC, le laboratoire européen de Xerox (XRCE) est basé en France. Nous avons été en compétition avec eux sur un gros projet et ils sont vraiment brillants dans leur domaine.
On pourrait rêver de poser le type de question suivante :

- Quelle est la population du Brésil ?

Malheureusement pour l’instant cela fait plutôt partie de la fiction.

L’idéal serait même que le moteur soit capable de faire la synthèse de différents documents pour ne donner que la réponse et non une liste de documents.

A commenter avec modération

Samedi 10 février 2007

En tant que blogueur débutant, je me pose des questions sur la façon de gérer les commentaires. Une remarque dans le post de Jean-Philippe m’inspire les interrogations suivantes :

  • Faut il utiliser la modération a priori, pour lutter contre le spam qui semble très important ? Mais dans ce cas on peut se heurter à des problèmes de “faux positif” entrainant pour l’auteur du commentaire un doute sur la raison réelle de la non-publication.

    moderation1.jpg

  • Faut il laisser les commentaires libres avec uniquement un simple enregistrement de l’auteur ? Et je présume que l’on peut se retrouver avec un spam incontrôlable.

Auriez vous des conseils sur l’usage des anti spam ou sur la gestion des commentaires ?

Drill Down : la recherche en profondeur

Vendredi 9 février 2007

Derrière ce nom un peu barbare se cache un concept de navigation de plus en plus utilisé pour la recherche.
Les définitions parlent souvent de “mécanisme de navigation dans une structure multidimensionnelle permettant d’aller du plus global au plus détaillé“. On parle aussi de “recherche par caractéristiques” (attribute search), “recherche par facettes” (faceted search), “recherche par paramètres” (parametric search)

drill12.jpg

Comment cela fonctionne :

  • Vous entrez votre requête de recherche de façon habituelle et vous obtenez une liste de résultats, souvent importante.
  • Puis vous allez affiner ces résultats via le drill down.
  • Ce dernier se présente souvent sous la forme d’un tableau de valeurs ou chaque colonne représente une caractéristique importante du domaine. Chaque ligne représente les valeurs qui existent dans ces attributs.
  • C’est ce dernier concept qui permet une recherche “à coup sûr” dans la liste de vos résultats.

Prenons par exemple le cas de la recherche d’une “robe rouge”. Si la liste de résultats qui apparait à l’écran vous semble trop longue, vous pourrez choisir comme caractéristique supplémentaire la matière (coton). Vous aurez alors une nouvelle liste de résultats. Vous pourrez choisir ensuite la marque et ainsi de suite… Bien sûr il est possible, à tout moment, de revenir en arrière ou de supprimer une caractéristique.

drill22.jpg

Comme vous l’aurez compris cela impose le traitement des données en amont. Il faut choisir les caractéristiques considérées comme importantes pour une catégorie (comme par exemple : la marque, la matière, la couleur dans la catégorie mode féminine). Puis il faut extraire, pour chaque document, la liste des valeurs pour chaque attributs. Cette extraction peut se faire à partir : de fiches produit, de calcul (pour les prix) ou d’extracteur d’attributs.

Dans la liste de vos résultats le drill down va vous proposer cette robe dans différentes matières, pour différentes marques et dans différentes tailles par exemple.

La plupart du temps il est indiqué le nombre de résultats pour chaque valeur de caractéristiques.

Ce type de présentation a été tout d’abord utilisé par le monde de la “business intelligence” pour naviguer dans des quantités énormes de données et ainsi pouvoir faire des focus et des allers-retours facilement (cube Olap). Puis cet usage est passé dans les moteurs de recherche spécialisés pour faciliter la navigation et éviter les recherches qui tombent dans le vide.

Un sabot après l’autre

Vendredi 2 février 2007

Enfin, après avoir acquis toute la panoplie du parfait petit blogueur (nom de domaine, hébergement , wordpress…), je me sens comme un âne batté, chargé de bonnes intentions.

sabots2.jpg

Encore merci à Benoît pour son temps et ses précieux conseils de vieux routier.
Dans cet espace j’essayerai d’aborder les thèmes qui me sont chers :

- Le monde de la campagne en général et “comment développer une startup au milieu des ânes” en particulier [donkey]

- Le monde du “search” en général et de celui du “vertical-search” en particulier [keyword]