WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Techniques d'extraction de connaissances appliquées aux données du Web

( Télécharger le fichier original )
par Malika CHARRAD
Ecole Nationale des Sciences de l'Informatique, Université de la Manouba, Tunis - Mastère en informatique, Option : Génies Documentiel et Logiciel 2005
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

4.2.6 Analyse de la carte topologique

Après la phase préliminaire d'apprentissage, la carte doit être organisée de manière à fournir unevue générale des résultats de la classification. Pour ce faire deux phases sont proposées par Lamirel [Lam, 01] : la phase de labellisation et la phase de la division de la carte en aire logiques.

Labellisation de la carte

C'est la première phase de l'assistance à l'analyse des informations fournies par une carte topologique. Elle consiste à attribuer aux classes obtenues des noms représentant au mieux leur contenu. Cette phase de labellisation des noeuds de la carte présente un problème. En effet, les profits des noeuds de la carte contenant la description des classes représentent le plus souvent des combinaisons complexes des composantes descriptives extraites des données. Pour pallier ce problème, il est possible d'adopter les stratégies dirigées par les profils des données qui consistent à attribuer à chaque classe un nom représentant la combinaison des labels des composantes dominantes du vecteur de profil du membre le plus caractéristique de la classe, ou d'un vecteur de profil calculé représentant le profil moyen de l'ensemble des membres de la classe.

Division de la carte en aires logiques

La seconde phase de l'assistance à l'analyse des informations fournies par une carte topologique consiste à diviser la carte en »aires logiques fermées» représentées par des groupes cohérents de noeuds. Chaque aire considérée comme une macro-thématique, fournit une information fiable sur l'importance relative des différentes thématiques de base. En effet, les thématiques les plus riches en données sont représentées par des aires plus importantes que les thématiques correspondant à des données marginales. Un processus de généralisation a été proposé par [Lam, 01] afin de résumer le contenu de la carte sous la forme d'un ensemble de classes plus génériques. Il s'agit, à partir de la carte originale, d'introduire de nouveaux niveaux de classification plus synthétiques, correspondant à de nouvelles cartes, en réduisant progressivement le nombre de noeuds de ces dernières. Comme les cartes originales ont été construites sur la base d'une structure de voisinage carrée entre les noeuds, la transition d'un niveau de généralisation vers un autre s'opère alors en construisant un nouvel ensemble de noeuds, dans lequel le profil de chaque noeud représente la composition moyenne des profils de quatre voisins immédiats sur le niveau original.

4.2.7 Avantages et limites de la carte de Kohonen

Les cartes de Kohonen, appelées aussi cartes à préservation de proximité, disposent de capacités d'apprentissage automatique, d'un bon pouvoir illustratif des résultats et d'une forte sensibilité aux données fréquentes. Elles permettent également de réduire efficacement la complexité calculatoire. Cependant, elles présentent certaines limites. En effet, la gestion des paramètres tels que la taille de la grille, les valeurs initiales des poids et le voisinage relèvent généralement d'une certaine expertise. D'autre part, l'interprétation des groupes constitués par les cartes de Kohonen nécessite souvent le recours aux techniques statistiques pour comprendre les facteurs caractérisant chacun des groupes. De plus, ce système considéré par la communauté scientifique comme »boîte noire» nécessite un grand ensemble d'apprentissage et ne garantie pas la convergence pour les réseaux de grande dimension.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld