Les standards pour nommer les Photos : Utilisation des champs Exif, IPTC et ceux de Photoshop.
Le Datamining consiste à extraire des informations pertinentes des bases documentaires type GED -Gestion Electronique de Documents. Pour cela il faut que les informations qui caractérisent un élément comme une photo jpg soient accessibles.
Pour définir les caractéristiques d’une photo numérisée (numérique ou scannée) les logiciels du marché proposent de remplir les informations décrivant la photo (métadonnées) dans une base de données liée au logiciel. En cas de copie d’une partie des photos pour les donner à une autre personne par exemple, les métadonnées doivent être exportées séparément et il faut pouvoir les regrouper dans le logiciel du micro ordinateur cible. Le résultat est souvent la perte des métadonnées car les logiciels ne sont pas compatibles.
Une solution consiste à intégrer les métadonnées dans le nom de la photo en nommant la photo sous la forme : AAAA-MM-JJ-Mot1_Mot2_Mot3.jpg et d’avoir un logiciel comme Regard qui sait réaliser des recherches multicritères sur ce nom de photo. Cette solution reste cependant assez limitée dans le nombre de mots servant à définir la photo. L'année AAAA, le mois MM et quelques mots. Une variété plus grande et mieux structurée de métadonnées (titre, copyright, nom de l'auteur, etc) peut-être souhaitée.
Il faut retenir un format pour placer les informations dans chaque photo. Il existe différentes instances internationales qui traitent du choix des formats dont l’EXIF (EXchangeable Image File). Les informations traitées sont les données techniques liées aux conditions de la prise d’une photo avec un appareil photo numérique dont la date de création de la photo, la focale, de temps de pause... Les champs EXIF sont initialement remplis par l’appareil photo numérique et il n’y a pas de champs EXIF dans une photo scannée.
L’instance internationale la plus crédible sur le sujet des noms des photos est L’IPTC (International Press Telecommunications Council). Le format IPTC est le plus facilement utilisable pour des photos JPG. Il existe d’autres instances dont la NAA (Newspaper Association of America) et l’ISO qui tente d’uniformiser avec le format SPIFF(ISO 10918). Des éditeurs travaillent sur ce sujet en ne cherchant pas a arranger les choses dont Microsoft avec Windows qui a ajouté son propre champs Commentaires sous Win XP et ce champs n'est pas compatible avec celui de Windows 2000. Il y a enfin le format XMP (Xtensible Metadata Platform) qui est lié à XML qui devrait devenir un des standards les plus utilisés.
Avec tous ces différents standards certains diront qu'il est urgent d'attendre qu’un standard s’impose. Une solution plus pratique consiste à posséder un traducteur du format des noms des photos de son logiciel utilisé régulièrement vers les différents autres formats standards.
Un des objectifs du logiciel Regard consiste à pérenniser le travail réalisé par les utilisateurs. Ces derniers ont pris le temps de renommer les photos au format proposé AAAA-MM-Mot1-Mot2-Mot3.jpg et c’est bien ce qui est le plus long. Pérenniser le travail consiste à intégrer un traducteur du format du nom pour pouvoir intégrer naturellement les photos dans d’autres logiciels qui savent ou sauront un jour, gérer dynamiquement des base de données de photos par la récupération des informations disponibles dans les photos (nom des photos, champs EXIF, IPTC, SPIFF, XML ou autres).