La tête dans le Python
Cela fait plusieurs jours que je me bats avec un nouvel algorithme. Et cette lutte me prend toute mon attention (devant et hors écran) , si bien que j’ai beaucoup de mal à effectuer mes taches habituelles de veille ou d’administration quotidienne.
Je me réveille en pleine nuit avec une nouvelle idée qui fonctionne une fois sur quinze, je me lève précipitamment en plein repas pour contrôler un bout de code … bref un vrai zombie.
Je ne sais pas si ceci arrive à certains d’entre vous qui officient dans le développement d’applications, mais quand on est dans un programme tout le reste disparait. C’est un peu comme si le cerveau ne pouvait pas gérer plusieurs domaines à la fois.

Tous nos moteurs de production sont développés en C (pur) mais nous effectuons les maquettes sous Python. C’est un langage très rapide à coder pour essayer des scenari, mais très lent dans l’exécution.

Le machin-truc sur lequel je travaille :
Ce devrait être (au conditionnel et si tout va bien) un “matcheur” qui sera capable de vérifier la similarité de plusieurs textes, pour :
- Agréger des Petites Annonces pour un même bien
- Agréger des Posts de blog sur un même sujet
- Agréger des offres de emarchands pour le même produit
- Lier des requêtes libres à des fiches produits d’un catalogue
- …
Nous comptons bien présenter cette application (sortie à l’automne) à notre marché habituel et nous allons aussi l’utiliser pour nos propres services qui sortiront en bêta privé début Juillet.

21 juin 2007 - 22:35
Intéressant ! S’il est possible de réaliser à partir de cela un outil permettant de mesurer, à des fins statistiques le taux de duplication des offres d’emploi sur Internet, je suis preneur
22 juin 2007 - 7:39
@ Yannick > Notre première volonté est de facilité l’expérience utilisateur pour la visualisation sans duplication des emplois, des biens immobilier, des news, des produits de shopping …
Mais nous pourrons également proposer des outils d’analyse du phénomène de démultiplication qui est le plus gros générateur de “bruit” du web
27 octobre 2008 - 19:04
Thanks for writing this.