L'espace web du sénégal : étude de son degré d'ouverture ´ travers l'analyse des liens hypertextes( Télécharger le fichier original )par El Hadji Malick GUEYE Université Paris 10 Nanterre - Master de Recherche 2005 |
II.4. Analyse du graphe du WebL'un des qualificatifs que l'on donne le plus souvent à Internet est : le réseau des réseaux. Ce qui implique naturellement l'idée de représentation, de graphe, de liens, de relations, d'interconnexion... « Le Web peut être modélisé comme un graphe mathématique en considérant ses pages comme des noeuds et comme arcs, les liens hypertextes.»75(*). Et pour Ingwersen et Björneborn (2001), la théorie des graphes est un excellent outil pour comprendre la structure des liens du Web. De manière très particulière, ces liens hypertextes représentent une importance de premier ordre en ce qu'ils déterminent même la structure mais aussi l'expansion et la taille de plus en grande du Web. Car, grâce à ces liens, créer sa page Web, s'ancrer aux autres sites et s'inviter ainsi au réseau global devient de plus en plus chose aisée, d'où la croissance exponentielle du Web (Larson, 1996). Par ailleurs, «The study of the structure of this graph is useful because of the importance of hyperlinks for search engine web crawlers and in information science web link research». (Björneborn, 2001). C'est pourquoi Han Woo Parker76(*) dit que : « L'élément structurel de base d'Internet est le lien hypertexte ». Mais avant d'entrer dans le vif du sujet et de montrer le caractère spécifique par rapport à la théorie des graphes en science sociale ou en bibliométrie, nous commencerons par quelques définitions opérationnelles sur le Web mais aussi sur les différents types de liens hypertextes. II.4.1 Quelques définitions opérationnellesLe Web, l'environnement Internet en général, dispose de ses propres termes et concepts qui permettent de bien le décrire et de le différencier de tout autre environnement. Un éclaircissement sur ces termes du point de vue conceptuel ne peut qu'être une chose nécessaire et même incontournable pour notre appréhension et notre compréhension, d'une part. D'autre part, cela nous permettra de bien cerner la relation qu'entretiennent ces différents éléments et comment ils sont structurés. v Quelques termes du web Les termes les plus « importants » du Web et que nous allons fréquemment utiliser dans cette étude sont : site Web, page Web, serveur Web, nom de domaine, URL : - Un site Web est un emplacement donné par un nom de domaine contenant une ou plusieurs pages Web, reliées par des liens hypertextes ou des images ancrées. Ces sites sont créés et maintenus par un individu, une compagnie ou une organisation77(*). - Si un site peut être conçu comme un terme Web, et représentant un document Web, le serveur Web est quant à lui un terme d'Internet représentant une ou plusieurs machines ou ordinateurs (Björneborn, 2004). Pour lui, cette distinction conceptuelle est essentielle car le Web et Internet sont deux entités différentes. Si le Web est un réseau de documents reliés par des liens hypertextes, Internet est un réseau de machines reliées par des câbles et des routeurs. - Un nom de domaine fonctionne comme un système d'adressage et d'identificateur avec un nom alphanumérique utilisé pour identifier une ou plusieurs adresses IP. Vu que Internet est basé sur l'adressage numérique (IP) et non sur les noms de domaine, chaque serveur Web a besoin d'un DNS (Domain Name Server) pour traduire les noms de domaine en adresse IP. Un nom de domaine basique est composé de trois segments : www.xxx.yy. Le dernier segment (yy), le Top Level Domain (TLD), peut désigner le code de domaine d'un pays (ex. .fr pour la France, .sn pour le Sénégal) ou le type de site : com, edu, gov, coop, ... - L'URL (Uniform Resource Locators) est un système standardisé d'attribution des adresses sur Internet. « Les URL identifient les ressources sur le Web : documents, images, fichiers téléchargeables, services, boites de messagerie électronique et autres ressources ... » (World Wide Web Consortium, 2002). Par extension, l'URL désigne aussi l'adresse d'un site ou d'une page Web. L'adresse URL complète est composée : 1 - du type de protocole (http, ftp ou gopher) 2 - du nom du serveur (ou nom de domaine) 3 - de l'emplacement exact du fichier Exemple : http://www.sonatel.sn/abonnements.htm 1 2 3 v Les différents types d'hyperliens S'il est acquis que le Web est aujourd'hui considéré comme un graphe avec comme noeud une page web par exemple et les hyperliens comme arcs, il n'en demeure pas moins que la nature de ces derniers (les hyperliens) ne sont pas toujours nette et clairement définie. Par exemple, on divise souvent les hyperliens en deux types : liens internes et liens externes. La définition ou la limitation de ces liens externes pose problème puisqu'il peut s'agir soit de liens sortant du site concerné vers d'autres sites ; soit des liens venant d'autres sites vers le site concerné.( Björneborn, 2004). Donc, tout cela mérite qu'on essaye d'y voir un peu plus clair, et c'est ce que nous allons faire en nous référant principalement aux notions développées, à travers un graphique, par Lennart Björneborn dans sa thèse.78(*) Figure 7 : Terminologie de base des liens wébométriques (Björneborn, 2004) Les lettres (A, B, C, D, E, F, G, H et I) désignent les noeuds et peuvent être des pages Web, des sites Web, des répertoires... Et les flèches sont les liens hypertextes qui relient ces différents éléments. Pour la compréhension des relations, traduisons les termes Inlink et Outlink respectivement par lien entrant et lien sortant. Ainsi, on a les relations suivantes : Ø B has an inlink from A; B is inlinked; A is inlinking; A is an in-neighbor of B Ø B has an outlink to C; B is outlinking; C is outlinked; C is an out-neighbor of B Ø B has a selflink; B is selflinking Ø A has no inlinks; A is non-linked Ø C has no outlinks; C is non-linking Ø I has neither in- nor outlinks; I is isolated Ø E and F have reciprocal links; E and F are reciprocally linked Ø D, E and F have in- or outlinks connecting each other; they are triadically interlinked Ø A has a transversal outlink to G: functioning as a shortcut Ø H is reachable from A by a directed link path Ø C and D are co-linked by B; C and D have co-inlinks Ø B and E are co-linking to D; B and E have co-outlinks Ø Co-inlinks and co-outlinks are both cases of co-links * 75 THELWALL, M., WILKINSON, D. (2002). Graph Structure in Three National Academic Webs : Power Laws with Anomalies. In : Journal of the American Society for Information Science and Technology, 54(8), 706-712. Disponible aussi l'URL : http://cybermetrics.wlv.ac.uk * 76 PARKER, Han Woo. (2003). Hyperlink Network Analysis: A New Method for the Study of Social Structure on the Web. In : Connections, 25(1): 49-61 * 77 www.webopedia.com/TERM/w/web_site.html . [site visité le 05/01/05] * 78 BJÖRNEBORN, Lennart. Small-world link structures across an academic web space : a library and information science approach. PhD dissertation. Copenhagen: Department of Information Studies, Royal School of Library and Information Science, 2004. xxxvi, 399 p. |
|