2.2.3 Diverses approches d'analyse
Il existe plusieurs méthodes d'analyse du trafic sur un
site Web dont les plus connues sont: l'analyse des Logs, l'analyse distante et
les panels.
Analyse des fichiers Logs
L'analyse des fichiers Logs consiste à collecter
automatiquement à partir des fichiers Logs les navigations de tous les
utilisateurs. Cette analyse permet de quantifier la fréquentation des
pages d'un site donné, déterminer les parcours de navigation, les
motifs de navigation et les profils des usagers du site
considéré. La faiblesse de cette approche est d'offrir peu
d'information sur l'utilisateur [Che, 02].
Analyse distante
L'analyse distante repose sur l'utilisation des marqueurs HTML
à placer sur chacune des pages du site étudié. Le marquage
consiste à placer une petite image (visible ou non) appelée
marqueur sur l'ensemble des pages Web à auditer. Le marqueur s'implante
sur un site Web afin de compter »les pages chargées». A chaque
chargement de page, le marqueur transmet au serveur les données
collectées (date et heure de la requête, informations sur le
navigateur, résolution de l'écran). Cette méthode fournit
une mesure directe de l'information (en temps réel). En revanche, elle
nécessite le marquage de toutes les pages, ce qui est presque impossible
dans le cas des sites volumineux.
Panels
Cette approche permet d'analyser les usages de l'Internet en
utilisant des panels d'utilisateurs représentatifs de la population des
internautes. Les données à analyser sont de deux types : d'une
part les données personnelles recueillies auprès de chaque
panéliste (âge, sexe, ancienneté sur le Web), d'autre part,
toutes les activités des panélistes sur Internet suivies et
capturées à l'aide d'un logiciel implanté sur leurs
ordinateurs. Cette approche présente l'inconvénient de ne pas
offrir une étude précise d'un site donné et n'est
utilisable que par des sites à très fort trafic.
Autres approches
[Che, 02] propose l'approche SurfMiner qui combine l'approche
panéliste et l'approche reposant sur l'analyse des fichiers Logs afin de
mettre en évidence les usages d'un site associés à des
descriptions d'utilisateurs. Cette approche repose sur l'hypothèse qu'il
existe une certaine corrélation entre les pratiques différentes
des utilisateurs et leurs caractéristiques personnelles. Elle consiste
à extraire des motifs fréquents de navigation des utilisateurs de
référence et découvrir des relations entre les motifs
découverts et des traits d'utilisateurs.
|