WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Techniques d'extraction de connaissances appliquées aux données du Web

( Télécharger le fichier original )
par Malika CHARRAD
Ecole Nationale des Sciences de l'Informatique, Université de la Manouba, Tunis - Mastère en informatique, Option : Génies Documentiel et Logiciel 2005
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.2.3 Diverses approches d'analyse

Il existe plusieurs méthodes d'analyse du trafic sur un site Web dont les plus connues sont: l'analyse des Logs, l'analyse distante et les panels.

Analyse des fichiers Logs

L'analyse des fichiers Logs consiste à collecter automatiquement à partir des fichiers Logs les navigations de tous les utilisateurs. Cette analyse permet de quantifier la fréquentation des pages d'un site donné, déterminer les parcours de navigation, les motifs de navigation et les profils des usagers du site considéré. La faiblesse de cette approche est d'offrir peu d'information sur l'utilisateur [Che, 02].

Analyse distante

L'analyse distante repose sur l'utilisation des marqueurs HTML à placer sur chacune des pages du site étudié. Le marquage consiste à placer une petite image (visible ou non) appelée marqueur sur l'ensemble des pages Web à auditer. Le marqueur s'implante sur un site Web afin de compter »les pages chargées». A chaque chargement de page, le marqueur transmet au serveur les données collectées (date et heure de la requête, informations sur le navigateur, résolution de l'écran). Cette méthode fournit une mesure directe de l'information (en temps réel). En revanche, elle nécessite le marquage de toutes les pages, ce qui est presque impossible dans le cas des sites volumineux.

Panels

Cette approche permet d'analyser les usages de l'Internet en utilisant des panels d'utilisateurs représentatifs de la population des internautes. Les données à analyser sont de deux types : d'une part les données personnelles recueillies auprès de chaque panéliste (âge, sexe, ancienneté sur le Web), d'autre part, toutes les activités des panélistes sur Internet suivies et capturées à l'aide d'un logiciel implanté sur leurs ordinateurs. Cette approche présente l'inconvénient de ne pas offrir une étude précise d'un site donné et n'est utilisable que par des sites à très fort trafic.

Autres approches

[Che, 02] propose l'approche SurfMiner qui combine l'approche panéliste et l'approche reposant sur l'analyse des fichiers Logs afin de mettre en évidence les usages d'un site associés à des descriptions d'utilisateurs. Cette approche repose sur l'hypothèse qu'il existe une certaine corrélation entre les pratiques différentes des utilisateurs et leurs caractéristiques personnelles. Elle consiste à extraire des motifs fréquents de navigation des utilisateurs de référence et découvrir des relations entre les motifs découverts et des traits d'utilisateurs.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"La première panacée d'une nation mal gouvernée est l'inflation monétaire, la seconde, c'est la guerre. Tous deux apportent une prospérité temporaire, tous deux apportent une ruine permanente. Mais tous deux sont le refuge des opportunistes politiques et économiques"   Hemingway