2.2. Résolution et mode d'image
La résolution détermine largement la
qualité de l'image numérisée. Elle se mesure en point par
pouce (PPP ou DPI en anglais). Plus la résolution est
élevée, meilleure est la définition ou qualité de
l'image, plus lourde est la taille du fichier. Dans ce cas, il est donc
important d'évaluer les besoins pour déterminer la
résolution appropriée. Il faut souligner que, très
souvent, une grande résolution très élevée
n'apporte rien à la qualité de l'image et constitue un gaspillage
de temps (pour la numérisation) et d'espace disque (pour le stockage des
fichiers). Il faut également prendre considération le mode de
calorimétrique, c'est-à-dire le type d'organisation des couleurs
de
28 Bibliothèque et
Archives Nationales du Québec.-La numérisation des documents :
méthodes et recommandation. Québec, 2012, P.23
71
l'image. Plus le mode calorimétrique offre une
gamme élevée de couleurs, plus les fichiers sont
volumineux.
Les modes colorimétriques sont les suivants
:
· 8 bits couleurs ou niveaux de gris ;
· 24 bits vraies couleurs ;
· 1 bit noir et blanc (bitonal).
Le mode 8 bits ou niveaux de gris offre 256 niveaux
de gris ou couleurs différentes. Il est recommandé pour la
plupart des documents monochromes, textuels, graphiques ou photographiques. Il
est généralement suffisant pour les documents comportant quelques
éléments en couleurs tels que : les en-têtes, les
signatures, etc.
Le mode 24 bits vraies couleurs offre 16 millions de
couleurs et s'impose pour tout ce qui nécessite un rendu de très
haute qualité en couleurs.
Quant au 1 bit noir et blanc, il restitue
approximativement l'original. Il n'est donc pas toujours recommandé,
même s'il est le plus avantageux du point de vue de la taille des
fichiers. Son utilisation convient dans les cas suivants :
· lorsque l'on numérise des documents en
excellent état ;
· lorsque l'on prévoit utiliser des
logiciels spécialisés comme Photoshop par exemple pour
rehausser l'affichage de l'image.
2.3. Formats de conservation des fichiers et
compression
Il existe un grand nombre de formats de conservation
de fichiers, mais très peu d'entre eux sont recommandés pour la
conservation à long terme des fichiers images. Selon la
Bibliothèque et Archives Nationale du Québec (BAnQ), trois
formats des fichiers sont recommandés pour la conservation à long
terme des documents numérisés. Il s'agit des formats : TIFF non
compressé, PDF/A et XML dont les caractéristiques
suivent.
2.3.1. Format TIFF non compressé
Le format TIFF (Tagged Image File Format) est le
format de plus en plus utilisé dans la conservation d'images
numériques. Bien que la taille des fichiers qui en résulte soit
grande, le format TIFF est généralement retenu pour la
conservation à long terme des documents numérisés. Dans le
projet de numérisation, il n'est pas recommandé d'utiliser des
formats de propriétaires comme format de conservation29.
Toutefois, en raison de sa popularité dans le domaine de l'imagerie
numérique et au sein d'organisations vouées à la
sauvegarde du patrimoine, le
29 Les formats
propriétaires sont des types de fichiers dont les spécifications
sont contrôlées par des entités privées. Leur
utilisation comme formats de conservation peut poser un certain risque puisque
les spécifications de ces formats ne sont pas rendues
publiques.
72
format TIFF demeure malgré tout un format
recommandable pour la conservation à long terme d'image
numérique.
2.3.2. Format PDF/A
Le format PDF/A (Portable Document Format) est
défini par la norme ISO 19005. C'est un format adapté pour la
conservation permanent et la diffusion de documents. Il préserve la mise
en page, les polices de caractères et la mise en forme. De plus, il
s'agit d'un standard ouvert et libre de droit. Sa raison d'être est la
conservation à long terme des documents
numérisés.
Il existe deux (2) version du format PDF/A : le
format PDF/A-1 et le PDF/A-2. « Le PDF/A-1 comprend : le PDF/A-1a et
le PDF/A-1b. Le niveau préserve la conformité de la structure
logique du document. Il représente la forme la plus complète de
la norme ISO 19005-1 (conformité intégrale). Le niveau 1b se
limite à la conformité visuelle du document. Ainsi, pour les
documents qu'on veut uniquement numériser en mode image, le niveau 1b
est suffisant. Pour les documents produits sous les Logiciels bureautique Word,
Excel, PowerPoint, open Office.., il est recommandé d'utiliser le
PDF/A-1a.
Le format PDF/A-2 ne remplace pas le PDF/A-1. Il
permet toutefois d'utiliser certaines fonctions des dernières versions
du format PDF qui ne sont pas autorisées sous le format PDF/A-1. Le
format PDF/A-2 permet, par exemple, l'utilisation du format JPEG 2000, des
effets de transparence et des couches d'annotations, l'empaquetage des polices
Open type ainsi que le regroupement de plusieurs documents en format PDF/A-1
dans un seul et même document. Le PDF/A-2 comprend un troisième
niveau de conformité : le PDF/A-2 u. outre la préservation de
l'aspect visuel du document, ce niveau offre la possibilité de
récupérer le texte en Unicode
»30.
2.3.3. Format XML
Le format normalisé XML (eXtensible Markup
Language ou Langage de balisage généralisable) produit des
fichiers basés sur un langage balisé favorisant l'échange
de données. Il offre de très grandes possibilités
d'utilisation des métadonnées nécessaires à la
gestion de documents. Il est également utilisé dans la
conservation à long terme des documents numérisés,
puisqu'il sépare la présentation et le contenu des documents.
L'utilisation du format XML ou formats basés sur l'utilisation de
schémas XML, par exemple Open Document Format (.odt) et OpenXML (.docx),
est particulièrement appropriée pour créer et conserver
des documents de type traitement de texte nés numériques ou qui
résultent d'une reconnaissance optique de caractère
(OCR).
Il existe deux versions du format XML : le XML 1.0 et
le XML 1.1 normalisées par le W3C31.
30 Bibliothèque et
Archives Nationales du Québec.-La numérisation des documents :
méthodes et recommandation. Québec, 2012, P.25
31 Les versions XML 1.0 et
XML 1.1 ont été respectivement créées en
février 1998 et en février 2004.
|