Archive pour la catégorie 'Search'

Search Crystal

Lundi 18 juin 2007

SearchCrystal est un nouveau métamoteur qui offre la particularité d’afficher les résultats sous forme très graphique.

Les possibilités de zooms, de focus sur des liens donnés , de contextualisations et autres catégorisations sont impressionnantes (voir la démo en home).

 

searchcrystal.jpg

 

A voir pour les fanas de nouvelle navigation (dont je fais parti)

L’ouverture d’un compte est obligatoire pour accéder à cette version beta.

Contrôle ultra-rapide de son positionnement sur G…

Lundi 4 juin 2007

J’utilise depuis un petit moment l’extension CustomizeGoogle qui permet de changer le look de votre moteur préféré.

Une petite astuce est de combiner les deux fonctions suivantes : …

  • Affichage des résultats sous forme d’une seule et unique page
  • Compteur de position

… pour vérifier son positionnement organique, par un simple “find” (CTRL F) sans avoir à faire défiler des dizaines de pages (en cas de mauvais classement)

Ci-dessous, l’exmeple des résultats de Donkeyword sur la requête “Apprentissage de la magie noire” (5ième sur 200 000), peut être une nouvelle idée de business 2.0 ;-)

 

magienoire1.jpg

 

Cette extension permet également

  • d’accéder aux autres moteurs en un seul clic
  • de supprimer l’affichage des liens sponsorisés

Et encore des dizaines de fonctions, mais je n’ai pas tout essayé.

Passe ton Google d’abord

Mercredi 30 mai 2007

En cette journée de mercredi (jour des enfants) et en cette période de pré-BAC, voici une petite révision sur la syntaxe des requêtes de Google.

googleformat.jpg

 

Tout le monde les connait mais un peu de répétition ne fait pas de mal.

  • titi -toto : le signe moins, devant le mot permet de supprimer les résultats comportant ce mot. Très pratique pour éliminer le bruit.
  • “titi * toto” : l’étoile au milieu des mots permet de trouver une séquence dont on ne connait que le début et la fin.
  • titi titi toto : la répétition d’un mot permet le sur-pondérer”

 

Pour aller un peu plus loin : la liste des opérateurs, avec notamment des possibilités d’intégrer des plages de valeur numérique.

Vivement le web sémantique, on peut toujours rêver.

Dans notre prochaine leçon, nous aborderons la capacité de prédire l’avenir de Microsoft en utilisant Google.

Boolgum : moteur de recherche à essayer

Vendredi 25 mai 2007

Boolgum est un moteur de recherche qui allie plusieurs technologies (une sorte de mashup-techno), pour nous offrir une expérience utilisateur différente.

Les résultats sont issus de Yahoo! Search et leur présentation reste très claire.

boolgum2.jpg

 

Fonctionnalités particulièrement pratiques :

  • Liste des synonymes (dans la colonne de droite) en partenariat avec Memodata
  • Définition d’un mot, par un simple double clique sur ce dernier, en partenariat avec Alexandria (un autre service de Memodata)
  • Recherches connexes (dans la colonne de droite)

Il faut savoir de temps en temps changer un peu ses réflexes habituels de search, pour essayer de nouveaux outils et celui ci vaut le détour.

PS : J’aime beaucoup le logo, une sorte d’escargot SF plutôt rigolo.

Google voit plus large

Jeudi 26 avril 2007

Après ses expérimentations sur de nouvelles interfaces ; SearchMash, Google teste une recherche élargie.

Il s’agit de proposer les résultats pour tous les services de Google (s’ils existent) ; Search, Image, Vidéo, Product, Patent …

 

googlevoitlarge.jpg

 

Dans cet exemple la recherche sur l’Ipod me propose d’aller voir aussi dans les onglets comme : products, patents & news.

A noter aussi le “related search” déja apparu dans des essais précédents.

Voir le billet de Christophe Asselin pour tester cette nouvelle interface.

Froogle atomisé

Lundi 23 avril 2007

Le service change de nom pour devenir Google Product Search, après avoir été viré de la home l’été dernier.

Le changement le plus visible est : … le nom et le look qui ressemble maintenant à celui du moteur classique.

 

googleproductsearch.jpg

 

Le business modèle ne subit aucune modification, c’est toujours celui des liens sponsorisés. En France Twenga suit la même logique.

Le plus surprenant est d’avoir placé la recherche par critère (drill-down) à la fin des résultats. Je trouve que c’est une ineptie pour la navigation.

 

J’ai passé l’année dernière quelques jours avec l’équipe de Froogle à Mountain View au Googleplex. Ce sont des gens vraiment très performants, dont beaucoup d’entre eux venaient de Shopping.com. Cet enterrement de première classe a du leur mettre un coup au moral.

 

Autres articles : Vapoware - Imazine.

Champ de recherche auto-suggestif

Jeudi 12 avril 2007

L’idée est de vous suggérer des mots ou des expressions en fur et à mesure de la saisie de votre requête.

Un exemple sur le moteur de Comparison Shopping : Become.com

searchfield.jpg

Dans ce type d’usage je trouve le drill-down beaucoup plus pertinent car il aide l’internaute en le plaçant directement dans la bonne catégorie ou le bon univers.

Cette aide à la saisie est également parfois utilisée pour l’entrée des noms de villes dans les sites immobiliers.

Via Capitaine Commerce

Comment les internautes lisent les résultats de recherche

Lundi 9 avril 2007

Un excellent dossier du Journal Du Net sur la compréhension de la lecture des résultats de recherche par les internautes.

Les comportements sont analysés par la technologie de eyetracking.

La variation de la longueur du résumé pour chaque résultat est particulierment intéressante et assez originale.

tailleduresume.jpg

Par contre, je suis un peu perplexe sur le protocole et notamment le nombre d’internautes pour cette enquête qui est seulement de 18 personnes. C’est peut être un échantillon un peu mince ?

Auto-Apprentissage : magie noire de l’AI.

Mercredi 21 mars 2007

L’auto-apprentissage (”machine learning“) est une méthode très utilisée dans le domaine de l’intelligence artificielle. Chez Sight’Up nous employons ce type de technique pour nos trois moteurs d’AI.

Comment ça marche ? Process de data mining textuel (catégorisation par exemple) :

  1. L’être humain montre des exemples au moteur. C’est la création du corpus étiqueté ou supervisé.
  2. Le moteur fait son apprentissage à partir du corpus étiqueté.
  3. Le moteur donne son avis sur des nouveaux documents qu’il n’a jamais vu.

 

Je fais souvent l’analogie avec l’éducation que les parents peuvent donner à leur progéniture. Mais c’est une éducation basée sur l’exemplarité du comportement sans aucune règle prédéfinie. L’enfant est capable seul, de se débrouiller même dans des situations inconnues. Il a développé son propre raisonnement en se servant de l’exemple de ses parents.

 

machinelearning.jpg

 

Les avantages :

  • Indépendance des langues selon les algorithmes (nos moteurs fonctionnent aussi sur les langues asiatiques)
  • Indépendance du domaine ou du métier

Les inconvénients qui lui sont reprochés :

  • Il faut disposer d’un corpus d’apprentissage de plusieurs milliers de documents pour avoir des résultats satisfaisants.
  • Effet boite noire (”black box”) car il est très difficile de définir à l’avance le “raisonnement” du moteur et il est impossible de lui ajouter des règles.

 

Comme vous pouvez le constater les meilleures technologies de machine-learnig sont celles qui diminuent l’intervention humaine et donc le coût de mise en oeuvre.

Pour cela nous avons parfois recours aux fonctions suivantes :

  • Ajout d’un exemple négatif dans le corpus d’apprentissage pour que le moteur se “recale” sans mettre en péril son apprentissage précédent.
  • Apprentissage semi-supervisé qui permet d’étendre la taille du corpus d’apprentissage.
  • “Active Learning” où les exemples montrés par l’humain ne sont pas pris au hasard mais choisis pour le système.

 

Nous concernant, nous avons développé et breveté une autre voie qui permet de faire un apprentissage sur une dizaine d’exemples en conservant d’excellents résultats de précision/rappel.

Je reviendrais certainement plus en détail sur cette méthode qui me passionne déjà depuis plusieurs années et qui me surprend encore quotidiennement par son effet “magique” et la pertinence de ses résultats.

Google cartographie les données.

Dimanche 18 mars 2007

Google vient d’acquérir la société Gapminder qui produit la technologie Trendalyser. Ce service, permet de faire des présentations visuelles de données en plusieurs dimensions.

 

gapminder.jpg

 

Une fonction particulièrement intéressante est l’usage des curseurs. Par exemple, le curseur placé sous l’abscisse peut faire défiler les graphes sur plusieurs années. C’est génial pour suivre l’évolution d’une situation dans le temps. J’avais déjà eu l’occasion de voir ce service mais je ne me souviens plus quand.

Une fois l’application chargée la navigation est très rapide. C’est un régal…

En espérant que Google pourra l’utiliser pour les résultats d’un search numérique ou pour son GoogleMap en surcouche.

Vu sur SearchEngineWatch