II-2- LE `COMMENT' DE LA GESTION DE L'INFORMATION II-2-1-
LA GESTION ELECTRONIQUE DES DOCUMENTS (GED)
Lorsqu'un document est sous forme numérique, il devient
facile et économique de les stocker sur un poste de travail ou un
serveur, de le retrouver, de le copier et de le transmettre à travers un
réseau à un autre poste de travail, le tout en quelques dizaines
de secondes. Plusieurs personnes peuvent les consulter en même temps. Les
outils de recherche deviennent si puissants qu'ils peuvent satisfaire dans des
délais très courts, n'importe quel type de recherche. L'espace
occupé par les documents est réduit dans des proportions
considérables.
Ainsi, les technologies `matériels' et `logiciels' pour
gérer électroniquement des documents sont maintenant
maîtrisées. Avec la baisse rapide des coûts, ces
technologies, autrefois réservées aux situations
les plus critiques, vont se diffuser largement.
Les applications de gestion électronique de documents
visent à prendre en compte le cycle de vie complet des documents, de
leur création jusqu'à leur archivage. La vie d'un document soit
papier ou électronique, suit en effet un cycle stable. Ce cycle fait
appel à des opérations de toutes sortes:
? Création
? Classement
? Copie
? Consultation
? Transmission
? Commentaires
? Annotations
? Révisions
Ces opérations ont une traduction différente pour
des documents papiers et des documents électroniques.
Créer un document est
l'opération maîtresse dans le cycle de vie d'un document. Elle
correspond à une phase de création du contenu, une phase de mise
en page, puis une phase de matérialisation. Pour les documents
électroniques, ce sont le éditeurs de texte qui prennent en
charge la création, la mise en page et l'affichage ou l'impression sous
forme finale avec une efficacité incomparablement supérieurs
à celle obtenue par les moyens classiques. Le développement de
l'utilisation des éditeurs de texte est lié à celui de la
bureautique, déjà largement accompli. Avec l'échange
électronique des documents, une part croissante des documents d'une
entreprise et ainsi sous forme numérique, ce qui ne peut que favoriser
l'utilisation des applications de GED pour en assurer la gestion et mise en
commun.
Classer un document correspond à deux
opérations différentes :
* Trouver au document une place pour le stocker,
* Enregistrer les informations nécessaires pour le
retrouver.
Dans la plupart des systèmes manuels de classement, ces
deux opérations sont confondues.Des étagères sont en effet
réservées à chaque thème. Il n'en est pas de
même dans les systèmes électroniques où chaque
document stocké reçoit un numéro de
référence.
Le système de classement ne gère plus que
l'association entre le plan de classement sous forme d'armoires, classeurs et
dossiers et les références des
documents classées à chaque niveau du plan. Un
même document peut ainsi être classé simultanément
(référencé) en plusieurs endroits du plan de classement
sans qu'il soit nécessaire de le copier pour autant. Le stockage des
documents électroniques et beaucoup moins coûteux que celui des
documents papier, et l'accès à un document par sa
référence y est quasi immédiat.
Indexer un document correspond à
enregistrer une fiche qui décrit les caractéristiques
significatives du document en vue d'une recherche ultérieure, à
la manière des fiches utilisées dans les bibliothèques.
L'indexation d'un document implique une connaissance de son contenu plus
détaillée que celle qu'exige l'opération de classement.
Dans certains cas, l'indexation de documents électroniques peut
êtres totalement automatisée, comme c'est parfois le cas dans des
applications de numérisation de documents avec reconnaissance de
caractères.
Copier un document est l'opération de
base de la communication papier dans le bureau. Dans le cas des documents
électroniques, c'est toujours une copie qui est délivrée
par les systèmes de classement. Le coût de copie
électronique est négligeable et la durée de
l'opération quasi instantanée. Dans bien des cas, la diffusion
classique par envoi à chacun d'une copie est remplacée par
l'information de l'existence d'un nouveau document dans le système de
classement.
Rechercher un document se fait, soit en
utilisant le plan de classement, soit en utilisant les fiches d'indexation.
Dans une bibliothèque, cela correspond à se promener à
travers les rayonnages, ou à feuilleter les fiches dans les bacs. C'est
incontestablement dans ces opérations que l'apport de l'informatique est
déterminant, puisque n'importe lequel des champs de la fiche peut
être utilisé comme critère de recherche ( sujet, auteur,
mots-clefs, date, nombre de pages). Ceci supprime l'équivalent des bacs
de fiches par thèmes, par auteurs, par titres, tels qu'on les trouve
encore dans bien des bibliothèques.
Envoyer/Recevoir un document (en fait une
copie d'un document), qu'il soit papier ou numérique, est le rôle
d'un service courrier. La messagerie électronique joue ce rôle
pour les documents numérique. Elle transporte une copie
électronique du document. Le document reçu est ainsi
révisable par l'éditeur approprié. Il peut être
directement classé et indexé. La messagerie électronique
est beaucoup plus rapide, fiable et économique que le courrier postal,
qu'il soit public ou privé.
Commenter un document, c'est n après en
avoir pris connaissance, rédiger des commentaires qui donnent à
l'auteur des indicateurs sur des améliorations
possibles. Les documentaires reçus sous forme
électronique peuvent être directement utilisés pour la
révision du document.
Annoter un document, c'est ajouter des
commentaires sur le documents luimême sans changer sa forme originale.
Des annotations papier modifient en fait le support papier document. Il n'en
est pas de même pour un document électronique puisque les
annotations sont enregistrées à part et sont
présentées par superposition sur l'image du document
affiché. Un document électronique annoté peut toujours
être présenté sans ses annotations.
Réviser un document, c'est en
créer une nouvelle version intégrant les modifications
nécessaires pour le rendre plus actuel ou conforme à son
objectif. Sur papier, cela veut dire recréer complètement le
document. Sous forme électronique révisable, c'est uniquement lui
appliquer les changements indispensables au moyen de l'éditeur de texte
qui a permis sa création, et gérer l'historique de ces
modifications.
Archiver c'est transporter le document de son
lieu de stockage vers un lieu d'archivage, moins cher, mais aussi moins
rapidement accessible. Le document peut disparaître de son système
de stockage d'origine et y libère la place qu'il occupait. Ce qui avec
les systèmes papier était une opération lente et
compliquée, devient une opération quasiment instantanée
avec les système de GED .il suffit de marque le document à
archiver,et régulièrement le système collecte les document
marqués pour les transférer et les stocker dans l espace
d'archivage . En cas de besoin, c'est en quelques minutes au plus que le
document archivé peut être rechargé dans l'espace actif.
Notons l'importance de la fonction d'archivage en terme de volume
conservé.
II-2-1-1- Documents papier, documents
électroniques
Les principaux avantages des documents électroniques par
rapport aux documents papier sont les suivants :
? Révisables directement et facilement
? Faciles à stocker, classer, indexer et rechercher.
? Accessibles à plusieurs, à distance
? Faciles et peu coûteux à copier, à envoyer
et à faire circuler
A ces avantages s'ajoute la possibilité de créer
des documents multimédia comportant, outre des textes et des images, des
sons ( voix,musique, enregistrement), de l'image animée (de la
vidéo), des tableaux de chiffres avec leurs formules de calcul, et du
graphique structuré à deux ou trois dimensions. Il
est bien sûr touj ours possible de traiter ces formes de
contenu au moyen de l' éditeur approprié.
En outre, les documents électroniques peuvent
être composés d'éléments partagée entre
plusieurs documents. Un document peut aussi pointer vers d'autres documents ou
parties de documents. Un mot souligné peut correspondre, lorsqu'on le
sélectionne, à l'apparition sur l'écran de sa
définition détaillée et l'ensemble de ses synonymes, mais
aussi à celle d'une photo. Un document de ce type, en fait un ensemble
de documents liés par des relations, est nommé ` hyper document'
dans le langage des informaticiens. C'est la forme de
présentation des documents disponibles sur Internet.
Cependant, pour pouvoir bénéficier de ces fonctionnalités
, il faut que les entreprises disposent de document sous forme
électronique . Or , elles recevront encore longtemps de l'
extérieur des documents papier .C' est particulièrement vrai pour
les relations entre les personnes et les entreprises .C'est là qu'
interviennent les technologies de numérisation .
II-2-1-2- Numérisation des documents
papier
La transformation d'un document papier en document
électronique se fait au moyen d'un numériseur .il s'agit d'une
sorte de photocopieur qui lit du papier et en produit une image
numérique sous forme de point .les appareils actuels sont capables de
prendre en compte des document couleur avec une définition
photographique, et des vitesses de quelque pages par minute à plusieurs
centaines de pages par minute.
Une fois numérisé un document est
éditable comme une image. Pour représenter sous forme
numérique son contenu (les textes. les images. les cadres).il faut
réaliser une opération de reconnaissance. Les logiciels de
reconnaissance de texte sont capables d'identifier les zones ne comportant que
du texte et de reconnaître la structure de chaque page et d'en
déduire un découpage en zones et une mise en page. Ils isolent
les parties images proprement dites et les laissent intactes. Le
résultat en un document révisable.
Lorsqu'il s'agit de formulaires, certains logiciels de
reconnaissance plus lourds sont capables de traiter l'écriture
manuscrite. Connaissant le type de formulaire, le logiciel reconnaîtra
ainsi les valeurs des différents champs du formulaire. Ces
données pourront être directement exploitées, par exemple
pour stocker et indexer ce formulaire. L'utilisation de codes à barres
permet d'indiquer simplement au système le type de formulaire ( facture,
note de frais, commande, déclaration d'accident...).
Les numériseurs haut de gamme avec alimentation
automatique travaillent par lots de plusieurs centaines de pages. Lors de la
saisie de masse en continu d'un lot, les pages du lot sont identifiées
par leur place dans le lot(n° de la page). Or le lot peut être
constitué d'une succession de documents, chaque document est
lui-même constitué d'un nombre variable de pages.
Pour permettre au système de faire la distinction entre les pages de
chaque dossier, des séparateurs sont introduits entre chaque dossier.
Ceci permettre le fonctionnement autonome du lecteur pour la durée du
lot. L'utilisation de logiciels de reconnaissance de caractères et de
forme permet d'aller beaucoup plus loin dans la séparation des
éléments du lot, par exemple en distinguant les pages de
couverture des documents.
Chaque fois que l'on numérise un document, il est
nécessaire de faire une vérification visuelle à
l'écran de la lisibilité de l'image numérique. Les
appareils sont en effet sensibles à la couleur et à la
qualité du papier et de l'impression, comme le sont les photocopieurs.
On en profite généralement pour indexer le document. L'indexation
peut être manuelle ou automatique ( à partir des informations
reconnues sur le document). Même dans le cas de la numérisation
par lots avec reconnaissance de contenu et indexation automatique, il faut
réaliser un contrôle visuel de la qualité obtenue. Compte
tenu de ces divers paramètres, une personne peut atteindre des
performances très variables : de 10 à 20 pages par minute dans le
cas du seul contrôle visuel (saisie par lots avec indexation
automatique). Pour aller plus vite, il faut introduire des techniques de
contrôle visuel par échantillonnage, dans lesquelles seul 1
document sur 10 ou plus est contrôlé.
Le cas du Fax est plus direct. Un Fax est un document qui a
déjà été numérisé. C'est l'image
numérise qui est transmise et reconstituée dans la mémoire
du Fax. Cette image peut donc être directement prise en compte par les
ordinateurs, stockée, et traitée telle quelle, sans
opération manuelle.
II-2-1-3- Classement et recherche
La référence de stockage est le seul moyen
d'accès au document. Il est toujours possible de prendre note de cette
référence et de l'utiliser directement ( bien que ce soit fort
incommode). C'est ce qui est fait dans de nombreuses applications où
c'est l'application elle-même qui enregistre la référence
de stockage du document dans sa base de données, par exemple
associée au client concerné par le document. Dans ce cas, on
pourra accéder aux documents uniquement à travers l'application
(pour chaque client, montrer la liste des documents associés).
Trois autres moyens de classer et de rechercher les documents
sont utilisés : le plan de classement, les fiches, le texte
intégral.
1- Plan de classement: IL présente un
classement hiérarchique de type armoire, dossier, tiroir, classeur. Il
faut gérer une base de données qui représentera cette
hiérarchie et associera à chaque niveau la liste des documents
rattachés par leurs références de stockage (ce que font
généralement les bons systèmes de GED). La recherche dans
ce cas se fera par accès au bon dossier puis rechercher dans le contenu
du dossier le bon document, exactement comme dans un système de
classement classique, mais en plus rapide. Ce mode de classement a l'avantage
d'être connu par tous et de ne nécessiter aucune formation. Il est
et restera largement utilisé bien qu'il soit inefficace pour la
recherche dans les grandes bases de documents.
2- Une fiche: qui décrit chaque
document au moyen d'une série de champs tels que date, client,
mots-clefs, produit. Chaque fiche est associé à un document et
connaît par sa référence de stockage. Il devient possible
`interroger le système au moyen d'une requête portant sur les
éléments de la fiche, par exemple :'tous les documents
postérieurs à 12/06/96 et concernant le produit clavier `. Ce
mode de recherche est beaucoup plus efficace que le précédent. Il
offre des modes d'accès multiples ( par client, par date, par produit).
Il est plus rapide en terme de temps de recherche. Il est cependant plus lourd
en indexation et un peu plus compliqué à utilisé.
3- Le texte intégral est un mode
d'indexation qui trouve de plus en plus de succès au fur et à
mesure que la puissance des systèmes augmente. Dans ce mode, c'est
l'intégralité de la partie texte du document qui est prise en
compte dans l'indexation ou la recherche. L'indexation est alors automatique.
Tous les mots du texte sont pris pour mot-clef. Sur une base de documents ainsi
indexés, il st possible de poser n'importe quelle question. Certains
logiciels ne réalisent jamais d'indexation mais analysent
systématiquement tous les textes de tous les documents à chaque
interrogation. Ceci économise les traitements d'innervation et l'espace
nécessaire pour les index (plusieurs fois l'espace du texte
indexé). Mais le coût de traitement d'une requête est
beaucoup plus élevé et le temps de réponse est beaucoup
plus long.
Ces trois moyens permettant de classer et de retrouver des
documents peuvent tous être utilisés en m^me temps pour des
données de natures différentes.
~ Un plan de classement pour les documents
connus par tous. Très facile à maintenir et d'accès
aisé, ce mode de classement est efficace si
l'on sait ce que l'on met d'habitude dans chaque armoire, tiroir,
et dossier.
~ Un classement par fiche pour les documents
nombreux et de même type. Par exemple un dossier par accident ou par
client, avec dans la fiche les éléments synthétique
décrivant l'accident et le client. Au prix de la création d'une
fiche pour chaque accident, il est possible de rechercher une sélection
des accidents selon, les critères variés.
~ Enfin une indexation automatique pour
l'ensemble des textes de jurisprudence propres à l'entreprise ( par
exemple l'ensemble des procédures du personnel). Ceci permettra une
recherche sut des critères imprévus et complexe.
II-2-1-4- GESTION DES VERSIONS
Un part importante de la GED traite la gestion des
différentes versions d'un même document, résultats es
modifications successives qui lui sont apportées. Ce problème est
particulièrement critique dans l'industrie pour la gestion des documents
de fabrication et de la maintenance des objets complexes. Lors de mise en
fabrication d'un produit, les concepteurs doivent fournir un dossier de
fabrication constitué d'un ensemble de documents décrivant chaque
élément à fabriquer dans la version correspond à la
version du produit. De même, lors de la livraison d'un produit au client,
les documentations d'utilisation et de maintenance doivent correspondre
à cette version.
Le premier besoin, c'est de gérer la
numérotation des différentes versions et les correspondances des
versions entre elles. Ainsi, il est important de savoir que la documentation
d'une machine version 1.1.2, correspond à celle de son moteur version
3.1.3.
Ce sont en effet précisément ces documents qu'il
faut utiliser ensemble et aucun autre. En général les
systèmes de gestion de version offrent une opération ` nouvelle
version ` qui crée une copie du document sous forme révisable. Ce
nouveau document est alors l'objet d'un cycle de modifications, envoi pour
commentaires, révision, approbation. Quand l'auteur le décide, le
document devient la nouvelle version du document source. Quand un document fait
référence à un autre document, il faut gérer les
évolutions d'indices des versions de chacun des documents et du lien
entre eux.
|