2.3- Données de l'usage :
Les principales données exploitées dans
le WUM proviennent des fichiers Logs. Cependant, il existe d'autres sources
d'informations qui pourraient être exploitées à savoir les
connaissances sur la structure des sites Web et les connaissances sur les
utilisateurs des sites Web.
2.3.1- Connaissances sur le site Web :
Les pages d'un site sont
matérialisées par une adresse Internet spécifique,
appelée adresse d'allocation de la ressource (Uniform Resource Locator).
La structure d'un site Internet simple peut être
représentée par un arbre dont la racine correspond à la
page d'accueil du site.
Figure 4 : Exemple d'arbre d'un site
Chaque point (ou noeud) présente l'adresse d'une page
particulière, et les segments reliant ces points indiquent la
présence d'un lien hypertexte amenant aux sous-branches
immédiates de l'arbre. D'après le schéma ci-dessus, il est
possible de retracer le chemin de navigation de l'internaute sur le site.
Cependant, il n'est pas toujours aisé de représenter
l'architecture d'un site, en particulier les sites complexes.
2.3.1- Connaissances sur les utilisateurs du site :
Les connaissances sur les utilisateurs d'un site sont
obtenues directement auprès des utilisateurs eux-mêmes dans
l'approche panéliste (âge, sexe, ancienneté sur le Web).
Dans le cas des sites à base d'inscription, ces connaissances sont
recueillies directement à partir du login et du profil de l'utilisateur
donné par l'internaute au moment de l'inscription. Ces données
dites explicites, fournies directement par les internautes sont très
souvent erronées. Il est également possible d'acquérir des
connaissances sur les utilisateurs du site en reconstituant leurs profils en
fonction de leurs activités passées sur le Web.
|