Notion sur l'indexation
L'indexation est une opération intellectuelle par
laquelle on va codifier le contenu d'un document. Cette opération
consiste à analyser le contenu de ce document (quelques soit son
support), et de le transcrire dans un langage documentaire. A partir de cette
indexation, on devra pouvoir effectuer une recherche des documents par leur
sujet. La double finalité du processus d'indexation est donc de
normaliser la codification du contenu des documents (sujet) et pour
l'utilisateur de faciliter la recherche du document.
"Un langage documentaire est un langage artificiel, ...
constitué de notions et de relations entre ces notions... C'est un
système de représentation synthétique du contenu des
textes.". Un langage documentaire est donc constitué par des termes
choisis (pas nécessairement issus du langage naturel) et par un
système de relations entre ces termes. Un langage documentaire se
caractérise également par une syntaxe (règles de
construction du langage)
Ces langages ont été élaborés pour
pallier les ambiguïtés du langage naturel (imprécision,
synonymie, polysémie). Une notion doit être transcrite de
manière univoque dans un langage documentaire. Il existe deux grandes
familles de langages documentaires employées dans des buts
différents.
a. Les
langages documentaires classificatoires
Les classifications proposent une organisation des
connaissances en un système [totalement] ordonné de classes et de
sous-classes. Leur structure est dite hiérarchique ou encore
arborescentes car elles parcourent le savoir des notions
générales aux objets particuliers.". L'objet principal des
classifications à l'heure actuelle est le rangement physique des
documents, ces documents étant rangés par sujets. Attention de ne
pas confondre cote et indexation ! Ces langages documentaires se
caractérisent par l'emploi d'indices alphanumériques. Les
classifications, dans une perspective de libre-accès aux documents,
permettent aux usagers de repérer les documents par leur sujet et de
naviguer entre les différents sujets. La Classification décimale
de Dewey, la Classification décimale universelle (CDU) sont les
classifications les plus employées aujourd'hui.
b. Les langages documentaires
analytiques
Certains auteurs emploient l'expression "langages
combinatoires". Le développement de ces langages est concomitant avec la
montée en puissance des moyens informatiques et leur puissance
d'analyse. Ces langages documentaires peuvent prendre plusieurs formes :
- Le lexique : liste de termes comportant des relations
d'exclusion (élimination de la synonymie).
- Le thésaurus : listes de descripteurs comportant des
relations d'exclusion (élimination de la synonymie) mais
également liés entre eux par des relations sémantiques et
hiérarchiques. Le thésaurus est généralement
spécialisé.
- La liste d'autorité : "Liste des vedettes [= termes
retenus pour l'indexation] et des termes exclus reliés entre eux par des
relations sémantiques élaborées et
développées au fur et à mesure des besoins des
bibliothèques qui l'utilisent. Elle est généralement
encyclopédique" (RAMEAU, 1999). RAMEAU constitue l'exemple-type de la
liste d'autorité.
1. Processus d'indexation
Ce processus s'effectue en trois étapes :
a. Compréhension et analyse du document
L'indexation consiste à repérer, à
sélectionner et à exprimer des informations contenues dans un
document primaire. C'est une opération de description interne, dont
l'objet est le contenu intellectuel du document. Les informations
sélectionnées dans les documents primaires sont exprimées
au moyen de termes d'indexation, de mot-clé, appartenant à un ou
plusieurs langages documentaires." (A. Gleyze). L'analyse du document est un
préalable indispensable et l'étape la plus sensible et la plus
importante du processus d'indexation. Sans une analyse correcte du document, il
est impossible d'indexer correctement un document. Ou dit d'une autre
manière, le travail d'indexation ne peut se résumer à une
routine technique. Il fait appel à toutes les capacités
intellectuelles de l'indexeur. En situation professionnelle, il faut parcourir
le document, ne pas se fier uniquement au titre ou aux parties liminaires, mais
parcourir la table des matières, éventuellement lire la
préface où l'introduction. Et si tout cela ne suffit pas, il faut
aller plus loin dans l'étude du document...
b. Extraction des mots-clés en langage naturel
Il faut dégager du document un certain nombre de
concepts, de notions exprimées sous forme de mot-clé. Ces
mots-clés sont encore exprimés en langage naturel à cette
étape du travail.
c. Transposition des mots-clés dans le langage
documentaire choisi
A partir de ces mots du langage naturel, il faut rechercher
une équivalence dans le langage documentaire choisi. Si le langage
documentaire choisi est une classification, on recherchera l'indice
approprié. Si le langage documentaire choisi est un langage analytique,
on recherchera les termes d'indexation appropriés qu'on assemblera
éventuellement selon la syntaxe prescrite.
|