II.3. Les concepts du Web
Le principe du web repose sur l'exploration d'une myriade de
pages web (fichiers HTML) contenant du texte mis en forme, des images, du son
des vidéos...L'exploration est rendue possible grâce à un
logiciel appelé navigateur (Firefox, Internet Explorer, Safari, ...) qui
offre une interface d'accès aux différentes informations
disponibles sur le web.
Les pages web sont liées les unes aux autres par des
liens hypertextes (ou hyperliens). En pratique un lien hypertexte est un simple
mot affiché sur un document permettant de passer à un autre
document lorsqu'on clique dessus. Le document lié peut être un
fichier à transférer, un son, une animation ou une page web.
Un site web (ou site internet) est ainsi un ensemble
logiquement structuré de pages web reliées entre elles et formant
un tout (le site) dédié à une organisation
donnée.
La création et la mise à jour d'un site peut
être confiée soit à une personne, le webmaster, ou à
une entreprise spécialisée, l'agence Web. Pour être
accessible sur internet, un site web doit être hébergé sur
un serveur web.
Le site web est habituellement architecturé autour
d'une page centrale, appelée «page d'accueil» et proposant des
liens vers les autres pages du site, et parfois des liens dits externes, vers
des pages étrangères au site
Pour rechercher une information sans connaître a priori
le site susceptible de la fournir, il est nécessaire d'utiliser des
outils de recherche. Il existe deux types de système de recherche sur
Internet :
- Les moteurs de recherche - Les annuaires web
+ Un moteur de recherche est un système
automatisé de recherche d'informations sur le web. Un "robot" se charge
de parcourir les sites pour visiter les pages web en suivant
récursivement tous les hyperliens rencontrés, puis d'analyser le
contenu des pages et de l'indexer (par extraction des mots clés
associés). L'utilisateur tape alors un mot ou une phrase dans le champ
de recherche, et le moteur de recherche retourne une liste de liens vers les
pages Web pertinentes.
+ Un Annuaire Web est un site Internet dont l'objet est le
référencement et la classification de sites Web, en
différentes catégories (ou rubriques). L'utilisateur peut alors
parcourir l'annuaire rapidement grâce à un système de
sélection de catégories et de sous catégories qui permet
d'affiner la recherche.
Bien qu'étant de plus en plus performants, les moteurs
et annuaires de recherche n'indexent pas la totalité des documents
présents sur internet. Il existe en effet, une grande masse
d'informations inaccessibles pour les outils de recherche "traditionnels" :
c'est le Web Invisible. Le web invisible comprend des bases, banques de
données et bibliothèques en ligne gratuites ou payantes...
|