Quoi de neuf sur la recherche multicritères ? Les moteurs de recherche que l’on utilise tous pour les recherches sur Internet évoluent pour devenir des moteurs de recherche sur les données du poste de l’utilisateur. La recherche peut être simultanée entre le Web et le local. Dans local il faut intégrer également les serveurs locaux de l’entreprise.

En local on a l’habitude d’utiliser l’explorateur intégré dans le système d’exploitation. Cependant l’Explorateur Microsoft n’a pas apporté de solution pour la recherche de photos jpg. Pire, entre les versions de Windows2000 et XP les champs Propriétés des jpg ont été modifiés. Ceci oblige les utilisateurs qui ont utilisé les propriétés dans Windows2000 de recommencer leur travail pour nommer les photos au passage sous XP.

 Le nouveau système d’exploitation Longhorn de Microsoft (ou Windows Vista) doit intégrer une base de données pour la recherche des informations mais la version beta actuelle n’intègre pas cette fonctionnalité et du retard est déjà prévu pour la première version qui l’intégrera.

 Entre temps un certain nombre d’acteurs, dont des éditeurs de logiciels, vont lancer des applications de recherche simultanées sur le poste client et le web (Desktop Search). Les acteurs actuels sont: AskJeeves, Blinkx, Copernic, Diskmeta, Google, Microsoft (il cumule les développements), Wizetech et Yahoo.

 Chaque Desktop Search semble avoir ses propres standards de recherche et la pertinence de ses standards est déjà un critère marketing en 2005.

 Si on limite le sujet à la recherche de photos en fonction de critères simples (Année, Mois, Mots) le bon choix des champs pour l’indexation reste inconnu. Il n’y a pas de règles claires ni communes entre les différents acteurs. Rien ne prouve qu’un utilisateur retrouvera ses photos en fonctions de ses critères.

 Il aurait été bien sur souhaitable de définir des standards pour quelques index majeurs caractérisant les photos (Année, Mois, Mots). La nécessité, pour les acteurs, de prendre des nouveaux marchés, dont celui de la publicité sur son moteur de recherche web, aura été plus fort que le coté définition pratique pour les utilisateurs. Même Google avec son logiciel Picasa n'a pas trouvé utile de travailler ce point pour le moment. Note que pour le reste Picasa est très pratique car facile à utiliser.

En ce qui concerne Regard, la volonté de maintenir une compatibilité ascendante entre le format des noms liés à Regard (AAAA-MM-xxx-yyy.jpg) et les standards émergents peut tourner à l’obsession mais renommer des centaines de photos prend de nombreuses heures. Il est souhaitable de pérenniser ce travail en choisissant des formats de noms de photos qui n’imposeront pas de recommencer à tout renommer lors de la sortie de nouveaux logiciels de Desktop Search (intégrés au système d’exploitation ou pas).

Sans standard, la seule méthode acceptable à ce jour est celle dont le résultat est modifiable via des modules logiciels convertisseurs. Dans ce cadre, la version 5 de Regard intègre un traducteur du format AAAA-MM-xxx-yyy.jpg vers les formats IPTC, Exif (en incluant la réécriture de la date) et Microsoft (format d’XP). Il reste à espérer que ces standards reconnus seront pris en compte comme informations majeures par les versions matures des logiciels de Desktop Search. Pour avoir un exemple simple sur l’avantage de Regard V5, click droit sur une photo affichée, au menu choisir Propriétés de la photo.

Le Datamining avec l'exif et l'IPTC (définitions).

Didier Favre.




Home du site       Le Datamining avec IPTC et Exif