Application du processus de fouille de données d'usage du web sur les fichiers logs du site cubba( Télécharger le fichier original )par Nabila Merzoug et Hanane Bessa Centre universitaire de Bordj Bou Arréridj Algérie - Ingénieur en informatique 2009 |
3. Résultats de l'analyse des fichiers Log du CUBBALa figure suivante illustre un résumé sur les statistiques obtenues du prétraitement des fichiers log du centre universitaire de Bordj Bou Arréridj Fichiers log
nombre de sessions 744 nombre de visites 1826 FIG 4.9. Statistiques de prétraitement de fichiers log
L'implémentation est une partie primordiale dans ce travail. Au cours de cette partie, nous allons décrire brièvement l'ensemble d'outils d'investigation utilisés durant les étapes de prétraitement. 4.1. DELPHI 7: Pour la réalisation de notre application, nous avons choisi le langage de programmation DELPHI 7, qui est un outil de développement puissant pour une programmation d'application sous WINDOWS. DELPHI 7 offre plusieurs avantages, on peut citer : Il apporte une grande souplesse aux développements lorsqu'il un fichier exe.il s'agit d'un vrai exécutable, aucun autre fichier n'est nécessaire pour l'exécution, vous obtenez donc une application plus propre et plus facile à distribuer et à maintenir. v' L'emploi des tableaux à plusieurs dimensions. 1' DELPHI est doté d'outils de programmation tels que les modèles d'application et des fichiers qui permettent de créer et de tester une application. v' Lors de la phase de transformation, nous pouvons visualiser les données (réelles), nous pouvons ainsi savoir aussi si le résultat de notes requis correspond à nos attentes. 4.2. Le langage SQL Pour le nettoyage de données nous avons eu recours au formalisme du langage de manipulation des données SQL, très répandu et de compréhension facile. SQL (Structured Query Language, en anglais, ou langage structuré de requêtes, en français) est un langage standard et normalisé, destiné à interroger ou à manipuler une base de données relationnelle. SQL se décompose en 3 parties, à savoir : v' La définition de données: création, suppression, modification de la structure des tables. v' Les manipulations des bases de données : Sélection, modification, suppression d'enregistrements. v' La gestion des droits d'accès aux tables : Contrôle des données : droits d'accès, validation des modifications 5. Conclusion Dans le cadre de ce chapitre, nous avons présentés les différents résultats de la méthodologie de prétraitement des fichiers Logs qui donne de bons résultats expérimentaux (18.10 % de la taille de la base après l'étape de nettoyage). A ce stade, la phase amont du processus se termine. Les données du web sont prêtent bien à La partie suivante qui constituant le coeur du processus, décrit l'application des techniques de la fouille d'usage du web aux fichiers log de CUBBA. |
|