II-2. DEFINITION DES ANNOTATIONS:
Une annotation est une note, une explication, ou tout sort
d'information attachée à une source de connaissance (un document,
phrase, un mot, image) sans toutefois être obligatoirement
insérée dans cette dernière. Elle peut être
réalisée en format papier qu'en format électronique.
II.3. DEFINITION DES ANNOTATIONS SEMANTIQUES:
L'annotation sémantique à
génération d'information spécifique, appelés
métadonnées sémantique, qui servent à la
description et l'interprétation d'une ressource pour un accès et
une gestion plus efficace.
II.4. INTERET DES ANNOTATIONS ET METADONNES :
1. Identifier et décrire les
ressources
- Mieux interpréter et décrire le contenu des
ressources. - Indiquer l'existence des données complémentaires -
Décrire les relations entre les ressources
2. Faciliter la recherche d'information
- Classer le contenu suivant un degré de
difficulté ou un public cible,
- Mieux référencer une ressources.
3. Faciliter
l'interopérabilité
- Partager et échanger des informations.
4. Faciliter la gestion et l'archivage
- Informer sur le cycle de vie des documents,
- Gérer des collections d'images
- Gérer des archives électroniques
5. Gérer et protéger les
droits
- Les droits de propriété intellectuelle. - Les
droits d'accès aux ressources.
6. Authentifier un texte
- Encoder une signature électronique pour valider un texte
sur Internet [site 9]
31 | ANNOTATION ET ONTOLOGIE
II-5. APPROCHES D'ANNOTATION :
Différents types d'informations peuvent être
associées à des images ou des vidéos. Ils sont :
II-5-1 METADONNEE INDEPENDANT DU CONTENU :
est liée à l'image, mais ne se décrit pas le
contenu comme le nom de l'auteur, date, lieu,...etc. Par exemple l'extraction
de l'endroit comme «Londres »à partir d'une image, y compris
des repères bien connus tels que « Tower Bridge »,
Les métadonnée indépendant du contenu ne
peuvent être extraites de l'image. [Hanbury. A, 2007]
II-5-2 METADONNEE DEPENDANT DU CONTENU : Les
données qui se réfèrent directement au contenu d'images
peuvent être divisées en deux types :
II-5-2-1. METADONNEES DEPENDANT DU CONTENU SYMBOLIQUE
: est liée aux caractéristiques de bas niveau (couleur,
texture, forme, .. etc.). Métadonnées
dépendant du contenu symbolique est facile
à extraire avec le temps de calcul nécessaire, on peut extraire
des vecteurs de caractéristiques énorme contenant
caractéristiques histogramme couleur, la texture caractéristiques
calculées par des algorithmes différents,...etc.
[Hanbury. A, 2007]
II-5-2-2. METADONNEES DESCRIPTIVES DE CONTENU
SEMANTIQUE : se réfère au contenu sémantique. Il
est préoccupé des relations d'entités image avec des
entités du monde réel ou événements temporelle,
d'émotions et de sens associée à des signes visuels et des
scènes. Annotation par des métadonnées descriptives de
contenu sémantique c'est le type d'annotation qui est plus
difficile à automatiser et qui nécessite de nombreux essais pour
évaluer la performance des algorithmes d'annotation.
Métadonnées descriptives de contenu peut être
spécifié à l'aide un ou plusieurs des approches suivantes
:
? Descriptions de texte libre : Aucune
structure prédéfinie
? Des mots-clés : les
mots-clés sont associés à l'image.
? Classifications basées sur des ontologies :
grands systèmes de
classification de différents aspects de la vie dans des
catégories hiérarchiques. C'est semblable à la
classification par des mots-clés, mais le fait d'une part que les
32 | ANNOTATION ET ONTOLOGIE
mots-clés appartiennent à une hiérarchie,
et d'autre part qu'ils facilitent des relations sémantiques entre eux
ces mots clés enrichit les annotations. Par exemple, il peut facilement
découvrir qu'un « chien » garder la maison [Hanbury.
A, 2007]
A. DESCRIPTIONS DE TEXTE LIBRE : Pour ce type
d'annotation, l'utilisateur peut annoter en utilisant n'importe quelle
combinaison de mots ou des phrases. Cela rend plus facile d'annoter, mais plus
difficile à utiliser l'annotation plus tard pour la recherche d'images.
[Hanbury. A, 2007]
Tous concepts qui ne peuvent pas être
adéquatement décrit par mots-clés sont le choix simplement
ajouté dans la description de forme libre. [Hanbury. A,
2007]
Le ImageCLEF 2004 bilingues ad-hoc
tâche de recherche a utilisé 25 catégories des images
chacun marqué par un titre semi-structurée (en 13 langues).
Exemples des versions anglaises de ces titres :
? Portrait pictures of church ministers by Thomas Rodger
? Photos of Rome taken in April 1908
? Views of St. Andrews cathedral by John Fairweather
? Men in military uniform, George Middlemass Cowie
? Fishing vessels in Northern Ireland
L'ensemble de données IAPR-TC12 de 20 000 images
contient des descriptions de texte libre de chaque image en anglais, allemand
et espagnol. Elles sont divisées en «titre», "description" et
"notes" champs. D'autres métadonnées de contenu
indépendant comme la date, le photographe et le lieu sont
également stockés. La figure 14 montre l'annotation de l'une des
photos. [Hanbury. A, 2007]
33 | ANNOTATION ET ONTOLOGIE
FIG-10 :L'annotation de l'une des images dans l'ensemble
de données IAPR-TC12.
|