3.4. Concepts de base de la fouille de données
d'usage du Web
La définition de certains termes qui se
répèteront tout au long de ce mémoire. Ces
définitions sont inspirées du travail de W3C sur la terminologie
de caractérisation du Web [06] :
concept
|
Définition
|
Ressource
|
une ressource R peut être tout objet ayant une
identité. Comme exemples de ressources nous pouvons citer: un fichier
html, une image ou un service Web.
|
Ressource Web
|
une ressource accessible par une version du protocole HTTP ou un
protocole similaire (ex. HTTP-NG).
|
Serveur Web
|
un serveur qui donne accès à des ressources Web.
|
Requête Web
|
une requête pour une ressource Web faite par un client
(navigateur Web) à un serveur Web.
|
Page Web
|
ensemble des informations consistant en une (ou plusieurs)
ressource(s) Web, identifiée(s) par un seul URL. Exemple: un fichier
HTML, un fichier image et un applet Java accessibles par un seul URL
constituent une page Web.
|
Navigateur Web (Browser)
|
logiciel de type client chargé d'afficher des pages
à l'utilisateur et de faire des requêtes HTTP au serveur Web.
|
Session utilisateur
|
un ensemble délimité des clics utilisateurs sur un
(ou plusieurs) serveur(s) Web.
|
Visite
|
L'ensemble des clics utilisateur sur un seul serveur Web (ou
sur plusieurs lorsque on a fusionné leurs fichiers logs) pendant une
session utilisateur. Les clics de l'utilisateur peuvent être
décomposés dans plusieurs visites en calculant la distance
temporelle entre deux requêtes HTTP consécutives et si cette
distance excède un certain seuil une nouvelle visite commence.
|
TAB 1.1. Les principaux termes utilisés
en Web Usage Mining.
3.5. Les applications de la TRKiOODIEeIERnWA IE'KADTeIdu
Web
Selon [22], l'analyse des fichiers log Web
est particulièrement utile car elle fournit des informations sur la
manière dont les utilisateurs naviguent réellement sur le site
Web. Après la réalisation d'une telle analyse, il est ainsi
possible de:
v mettre en évidence les fonctionnalités les plus
et les moins utilisées dans le site.
v chercher à comprendre les raisons pour lesquelles
les fonctionnalités les moins utilisées sont
délaissées par les utilisateurs afin, selon les cas, de les
améliorer ou de les supprimer.
v personnaliser la consultation, cet enjeu important pour de
nombreuses applications internet ou sites de e-commerce consiste à
proposer des recommandations dynamiques à un utilisateur en se basant
sur son profil et une base de connaissances d'usages connus.
Le WUM peut encore apporter des avantages à d'autres
domaines, comme par exemple, l'ajout dynamique de liens dans des pages Web, la
recommandation de produits, la caractérisation de groupes
d'utilisateurs, l'amélioration de politiques comme le caching , etc.
|