La tête dans le Python

Cela fait plusieurs jours que je me bats avec un nouvel algorithme. Et cette lutte me prend toute mon attention (devant et hors écran) , si bien que j’ai beaucoup de mal à effectuer mes taches habituelles de veille ou d’administration quotidienne.

Je me réveille en pleine nuit avec une nouvelle idée qui fonctionne une fois sur quinze, je me lève précipitamment en plein repas pour contrôler un bout de code … bref un vrai zombie.

Je ne sais pas si ceci arrive à certains d’entre vous qui officient dans le développement d’applications, mais quand on est dans un programme tout le reste disparait. C’est un peu comme si le cerveau ne pouvait pas gérer plusieurs domaines à la fois.

 

python2.jpg

 

Tous nos moteurs de production sont développés en C (pur) mais nous effectuons les maquettes sous Python. C’est un langage très rapide à coder pour essayer des scenari, mais très lent dans l’exécution.

trait1.jpg

Le machin-truc sur lequel je travaille :

Ce devrait être (au conditionnel et si tout va bien) un “matcheur” qui sera capable de vérifier la similarité de plusieurs textes, pour :

  • Agréger des Petites Annonces pour un même bien
  • Agréger des Posts de blog sur un même sujet
  • Agréger des offres de emarchands pour le même produit
  • Lier des requêtes libres à des fiches produits d’un catalogue

Nous comptons bien présenter cette application (sortie à l’automne) à notre marché habituel et nous allons aussi l’utiliser pour nos propres services qui sortiront en bêta privé début Juillet.

Autres articles sur le même sujet:


3 réponses à “La tête dans le Python”

  1. Yannick :

    Intéressant ! S’il est possible de réaliser à partir de cela un outil permettant de mesurer, à des fins statistiques le taux de duplication des offres d’emploi sur Internet, je suis preneur ;)

  2. Franck :

    @ Yannick > Notre première volonté est de facilité l’expérience utilisateur pour la visualisation sans duplication des emplois, des biens immobilier, des news, des produits de shopping …
    Mais nous pourrons également proposer des outils d’analyse du phénomène de démultiplication qui est le plus gros générateur de “bruit” du web ;-)

  3. Tirzah :

    Thanks for writing this.

Laisser un commentaire