6.3 Procédure de classification d'une visite
Dans cette section, nous avons pour objectif de classifier un
utilisateur du site dans l'une des catégories définies
précédemment en fonction de son comportement sur le site. Pour ce
faire, nous considérons une de ses visites au site i.e. un ensemble de
requêtes effectuées par un couple (IP, User Agent) dont le
délai séparant deux requêtes consécutives ne
dépasse pas 30 minutes. D'après la méthodologie que nous
avons proposée, il faut tout d'abord identifier les requêtes aux
pages de contenu de celles effectuées aux pages auxiliaires, ensuite,
découvrir le motif de navigation de l'internaute. Selon son motif de
navigation, l'internaute sera affecté à l'une des
catégories des utilisateurs du site. A titre d'exemple, prenons la
visite suivante effectuée par un utilisateur dont l'adresse IP et le
User Agent sont les suivants:
2Laboratoire de Recherche Opérationnelle, de
Décision et de Contrôle de processus
- 196.203.33.14
- Mozilla/4.0+(compatible ;+MSIE+6.0 ;+Windows+NT+5. 1)
Les requêtes effectuées par cet utilisateur sont
présentées dans la figure suivante:
TAB. 6.4: Visite à classifier
D'après les résultats de la classification des
pages effectuée à la section 1 de ce chapitre, nous identifions
la requête 9412 comme une requête à une page auxiliaire. Les
autres requêtes sont effectuées sur des pages de contenu. La
variable »Niveau 1» permet d'identifier le motif de navigation en se
servant des figures 6.15 et 6.16. Ainsi, le motif de navigation correspondant
est »institutions universitaires». De plus, si nous examinons les
variables : durée de la visite (1501 secondes, environ 13 minutes),
durée moyenne par page (187, 6 secondes) et nombre de requêtes par
visite (8 requêtes) dont les valeurs sont assez proches des valeurs
moyennes de la première classe (Durée moyenne des visites = 1728,
Durée moyenne par page = 233 secondes et nombre moyen de requêtes
par visite=5, 5) nous pouvons affecter l'internaute, qui a effectué
cette visite, à la classe des universitaires dont l'objectif est la
visite des institutions universitaires et le téléchargement des
cours.
6.4 Conclusion
La classification des utilisateurs du site se résume en
deux étapes : classification de requêtes puis classification des
visites. Au niveau de chaque étape, nous avons effectué une
classification à deux niveaux en se servant de deux méthodes de
classification. Ce travail a aboutit à la découverte de quatre
groupes d'utilisateurs du site du CCK à savoir des universitaires ayant
pour centre d'intérêt les activités des institutions
universitaires et le téléchargement des cours, des chercheurs
ayant pour seul centre d'intérêt les activités de recherche
des unités et laboratoires de recherche, des visiteurs ayant pour
objectif la découverte du site et des agents ou robots web.
|