VÉGÉTAUX logo_notes ET PAYSAGE

Voir les plantes autant que les savoir

Classifications et archivage des images numériques

Quelques considérations

Processus de connaissance du paysage
Processus de connaissance du paysage

Éléments de la problématique

L'ordre a un effet sur l'efficacité d'utilisation de l'information

Dans chaque projet nous traitons de nombreuses images. L'ère de l'informatique ajoute un supplément de complexité à la gestion de nos images.

Voici les bases pour réfléchir au problème de classement des images.

Un original et des doubles

La copie est la force de l'informatique

Il faut en premier lieu comprendre qu'il faut gérer deux entités distinctes: les vraies photographies (diapos, papier, cartes postales...) et leurs doubles informatiques (images numérisées). Il n'y a qu'un seul original mais il peut y avoir plusieurs doubles (imagette, image à 75dpi, image à 300dpi, extrait)

La correspondance entre les différentes représentations et l'original doit être garantie par une identité partielle de nom ou une table de correspondance. L'identité de nom facilite le travail. Seul la partie du nom permettant le rangement doit être identique, la partie descriptive de la copie doit varier. L'original a préséance sur ses doubles pour fixer le nom commun à tous.

Le nom doit être complété d'un index

Index le doigt

Le nom du fichier ne peut pas contenir tous les éléments qui seront utiles pour retrouver rapidement les images. Il faut donc accompagner les images d'un index descriptif.

Pointer du doigt autre chose est d'une simplicité remarquable mais également un grand risque. Les pointeurs sont la plus grande source des bugs de l'informatique.

Il faut faire des dossiers pour garder de la vitesse

Ne jamais surcharger les baudets, ils n'apprécient pas

Pour garder une bonne vivacité d'accès aux images, il faut éviter de dépasser la centaine d'images par répertoire. Une vingtaine est l'idéal.

Ce n'est pas parce que les ordinateurs vont de plus en plus vite qu'on ne doit pas faire attention. La dimension est liée à la vitesse. C'est vrai dans de nombreux domaines et cela se vérifie rapidement en informatique.

Il faut choisir entre un projet et plusieurs projet

Pas toujours facile de prévoir le développement des situations

Il faut savoir si la base d'image devra pourvoir servir à d'autres études plus tard. (Classification définitive ou classification pour le projet).

Plusieurs projets méritent une classification neutre

Si la classification est définitive, le descripteur du nom de fichier doit être universel. L'ordre chronologique est alors le meilleur système. Il permet de structurer les dossiers par années, par mois et éventuellement plus (jour, heure, minute, seconde) en cas de très grosse base de donnée. Dans un classement permanent, il faut éviter les systèmes à deux entrées (et plus) par exemple temps et lieu car il y aura ambiguïté dans l'utilisation. Les entrées autres que celles de la structure de stockage se feront par des index. Il peut y avoir autant d'index que de thèmes intéressant l'étude et toute nouvelle étude pourra ajouter des index sans modifier la base de stockage.

La classification thématique est efficace pour un projet isolé

Si la base est détruite ou gelée après l'étude, il vaut mieux utiliser une entrée par thesaurus. C'est à dire une structure hiérarchique des thèmes et des sous thèmes de l'étude. Cette structure a comme implicite que le thesaurus soit établi à priori et ne permet pas d'y revenir en cours d'étude. C'est la structure du thesaurus reprise dans les répertoires et sous-répertoires qui sert d'index aux images. Dans mon expérience, le classement par thesaurus ne fait gagner du temps et du confort que pour les études très courtes sur des thèmes anormaux par rapport au travail ordinaire. Le temps gagné au départ à ne pas faire les index est reperdu à refaire de nouvelles images à chaque étude. (C'est aussi un concept de pollution que ma morale écologique réprouve.)

Le nom de fichier indique son lieu de rangement et son identité propre

Ce n'est pas une obligation mais c'est pratique

Pour classer et retrouver rapidement une image dans un dossier il faut que le nom de fichier comporte les indications de la structure hiérarchique des dossiers dans lesquels il est rangé. Par exemple A/2000/05/A200005cb12.jpg où cb12.jpg est le nom spécifique du fichier et A200005 la partie de son nom qui correspond à la structure de rangement.

Le nom spécifique du fichier peut comprendre un simple numéro d'ordre. Il faut alors préférer un nombre avec une structure fixe ou les 0 servent au remplissage ex 002 pour que l'ordinateur classe les fichiers dans le bon ordre. Il peut aussi comprendre des indications avec des lettres pour faciliter le repérage.

Les doubles se mettent dans des structures parallèles

Encore un truc pratique

Pour faciliter le rangement des originaux et des doubles, il y a intérêt à les mettre dans une structure parallèle. Cette similitude permet à la fois des réflexes d'utilisation et l'automatisation de certaines tâches.

 original/2000/05/200005cb12.jpg
 imagettes/2000/05/A200005cb12.jpg
 pour-ecran/2000/05/B200005cb12.jpg
 avant-projet/2000/05/C200005cb12bleu.jpg
 

Un fichier pointé par l'index est a construire systématiquement

Le doigt doit pointer vers quelque chose

Le nom de fichier ne suffit pas à connaître son contenu, il faut au moins un fichier de référence qui dit ce qui est pointé par l'index. Le minimum et le plus pratique est une liste où chaque nom de fichier est associé à un texte sur son contenu qui répond aux questions qui? quoi? où? quand? et éventuellement plus. Exemple:
200005cb12.jpg - Le pont Jacques Cartier vu depuis la Ronde 12 mai 2000 lumière bleuté du matin

Les mots dans cet index descriptif sont important car ce sont eux qui seront retrouvés dans les outils de recherche en plein texte.

Lorsque le domaine de connaissance est déjà bien établi et que les types d'utilisation sont aussi répertoriés, une base de donné avec des mots clefs permet un accès plus rapide au contenu, ils sont indispensables pour les très grosses banques d'images ou si des calculs sur la banques d'image doivent être effectués.

L'index visuel est très utile

Une planche contact des photos est très utile pour revoir les images en laissant travailler sa sensibilité simplement guidé par une intuition vague.

Des outils automatiques sont utiles pour générer ces planches. La mise en fichier html des imagettes est aussi une bonne solution car elle permet de créer plusieurs index visuels sans nouvelle fabrication d'images. (voir exemple par date et par sujet)

L'hypertexte comme ressource inépuisable d'index et de pointeurs

Les fichiers html permettent de visualiser texte et images de la base en organisant le texte indépendamment du stockage des images. Chaque nouveau fichier peut donc restructurer les images et leurs légendes à sa façon, voir le monde d'un œil nouveau. L'immense avantage est que les images ne sont pas dupliquées. Elles n'existent physiquement qu'une seule fois dans l'ordinateur mais peuvent apparaître à de nombreux endroits et dans de nombreux textes différents. Une personne peut donc travailler l'image du projet pendant que d'autres travaillent sur les textes du projet dans différentes possibilités d'interprétation de cette image.

 

Pour en savoir plus

pub