2.1.3 Les
principales balises
Le contenu d'un document RSS se situe toujours entre les
balises <rss>. Elles possèdent obligatoirement un attribut version
qui spécifie la version à laquelle le document RSS est
conforme.
Au niveau suivant de cette balise se trouve une unique balise
<channel> qui contiendra les métadonnées du flux RSS,
obligatoires ou non, ainsi que la liste des contenus.
2.1.4
Métadonnées
En ce qui concerne les métadonnées, trois
éléments sont obligatoires dans un channel:
· <title> : Définit le titre du
flux ;
· <description> : Décrit succinctement
le flux ;
· <link> : Définit l'URL du site
correspondant au flux.
D'autres éléments optionnels existent
comme :
· <pubDate> : Définit la date de
publication du flux ;
· <image> : Permet d'insérer une image
dans le flux ;
· <language> : Définit la langue du
flux.
2.1.5
Contenu : Description de chaque article
Pour chaque article, une balise <item> est
ajoutée dans notre document.
Dans cette balise se trouvent les données
correspondantes à l'actualité sous forme de balise. Les balises
les plus courantes sont :
· <title> : Définit le titre de
l'actualité.
· <link> : Définit l'URL du flux
correspondant à l'actualité.
· <pubDate> : Définit la date de
l'actualité.
· <description> : Définit une
description succincte de l'actualité.
· <guid> : Définit de manière
unique l'actualité.
Selon la DTD RSS 2.0, il doit y avoir au moins un
<title> ou une <description> dans un item et le reste des balises
est optionnel.
D'autres balises existent comme :
· <author> : Définit l'adresse
électronique (mail) de l'auteur.
· <category> : Associe l'item à une
catégorie.
· <comments> : Définit l'URL d'une page de
commentaire en rapport avec l'item.
· <namespaces> : C'est une extension des flux RSS
qui permet d'inclure des nouvelles fonctionnalités comme iTunes par
exemple.
2.2 Les réseaux Pair-à-Pair
Une définition du Pair-à-Pair ou P2P ou pair
à pair est : «Pair-à-Pair computing is the
sharing of computer resources and services by direct
exchange between systems» [5]. Une autre définition est :
«Pair-à-Pair refers to a class of systems and
applications that employ distributed resources to perform a
critical function in a decentralized manner» [6].
2.2.1 Objectif Pair-à-Pair
Le modèle P2P étant très
général, des applications de nature très
différentes peuvent l'utiliser, les objectifs sont variés [4] :
· Partage et réduction des coûts entre
les différents pairs ;
· Fiabilité et passage à
l'échelle, l'absence d'élément centralisé pour
l'échange des données permet d'accroître la
fiabilité en supprimant tout point central de panne et
d'améliorer le passage à l'échelle en évitant les
goulots d'étranglement ;
· Localisation des ressources. Ceci permet
l'Agrégation des ressources et interopérabilité, en
mettant en commun des ressources individuelles comme de la puissance de calcul
ou de l'espace de stockage.
· Aucune administration centralisée :
autonomie des pairs en l'absence d'une autorité centrale. Les pairs
peuvent se connectés/déconnectés à tout moment
· Communication ad-hoc et collaborative.
2.2.2 Classification des systèmes
Pair-à-Pair
Plusieurs études essayent de classifier, les
systèmes Pair-à-Pair. Trois grandes catégories
peuvent être identifiées : centralisé,
décentralisé, et hybride. La catégorie
décentralisée peut encore être divisée en
structurée et non structurée. La différence principale
entre ces systèmes est le mécanisme utilisé pour
rechercher des ressources dans le réseau Pair-à-Pair.
2.2.2.1 Réseaux Pair-à-Pair
centralisés
Dans les systèmes Pair-à-Pair
centralisés, la description et l'adresse des ressources sont
stockées dans un annuaire d'un serveur central. Ainsi, les noeuds
envoient des requêtes au serveur central pour trouver quels noeuds ont
les ressources désirées. Le serveur ne fournit que la
capacité de rechercher et négocie les
téléchargements entre clients. De ce fait, le contenu reste du
côté client, ne passant jamais par le serveur. Après avoir
reçu une requête d'un pair, l'index central recherche le meilleur
pair dans son annuaire pour répondre à sa requête. Le
meilleur pair est celui qui est le plus économique, le plus rapide ou le
plus disponible selon les besoins de l'utilisateur. Lorsque le nombre de
participants devient trop grand ce modèle comporte quelques
inconvénients dus à son infrastructure centralisée,
notamment la surcharge de l'annuaire responsable d'accueillir les informations
de tous les participants. Cette catégorie de réseaux
Pair-à-Pair ne peut pas s'étendre à de
très grands réseaux. De plus, l'existence d'un centre unique,
même s'il est dupliqué, ne permet pas une bonne fiabilité
du réseau. Celui-ci peut tomber en panne à cause d'un seul noeud.
Napster a été l'exemple le plus connu reposant sur ce
modèle.
2.2.2.2.a Réseaux Pair-à-Pair
décentralisés et non structurés
Les systèmes décentralisés et non
structurés sont ceux au sein desquels il n'existe ni annuaire
centralisé, ni connaissance où se situent les noeuds du
réseau (la topologie), ni adresse sur l'emplacement des fichiers. Le
logiciel de P2P Gnutella en est un exemple. Ce réseau est formé
de noeuds qui rejoignent le réseau P2P en suivant quelques règles
simples. L'emplacement des fichiers n'est fondé sur aucune connaissance
de la topologie. Pour trouver un fichier, un pair demande tout simplement
à ses voisins qui eux-mêmes vont demander à leurs voisins
s'ils n'ont pas le fichier considéré, et ainsi de suite. Ces
architectures non structurées sont extrêmement résistantes
aux noeuds entrant et sortant du système. Par contre, l'actuel
mécanisme de recherche n'est pas adapté aux très grands
réseaux (on dit que le réseau ne passe pas à
l'échelle) et génère une charge importante sur les
participants du réseau. Les exemples de cette catégorie sont
nombreux comme FreeNet ou Gnutella.
2.2.2.2.b Les réseaux Pair-à-Pair
décentralisés mais structurés
Les systèmes décentralisés mais
structurés n'ont toujours pas de serveur central mais ils sont «
structurés » dans le sens où leur topologie est strictement
contrôlée et les fichiers sont stockés dans des endroits
spécifiques pour faciliter les recherches. Ils sont dits
structurés car les noeuds participants à l'application P2P sont
reliés entre eux selon une structure particulière comme un
anneau. Ce type de réseau a été défini pour rendre
des services de routage et de localisation fondés sur le
Pair-à-Pair.
Les systèmes Pair-à-Pair
décentralisés mais structurés possèdent un
algorithme de recherche pour lequel une ressource donnée se trouve en un
endroit parfaitement déterminé à l'avance. Cet endroit a
été calculé pour qu'il soit le plus simple d'accès
aux autres peers du réseau.
L'algorithme de recherche est donc complètement
déterministe, et les liens entre les pairs sont faits suivant des
règles bien définies. Cette structure permet la découverte
efficace des fichiers partagés. De plus, elle est
particulièrement appropriée au développement de
réseaux à grande échelle. Dans cette catégorie, on
peut placer Chord, CAN (Content Adressable Network), Tapestry, Pastry, Kademlia
et Viceroy.
2.2.2.3 Les réseaux Pair-à-Pair
hybrides
Les réseaux hybrides permettent de résoudre des
problèmes de l'approche purement distribuée tout en gardant
l'efficacité de la solution centralisée. Les réseaux
fondés sur ces mécanismes de localisation et de routage de
données peuvent supporter un nombre de pairs de l'ordre du million.
Cette solution combine les caractéristiques des modèles
centralisés et décentralisés. La décentralisation
signifie, entre autres, l'extensibilité, la tolérance aux fautes
et le passage à l'échelle. La centralisation partielle implique
quelques centres serveurs qui contiennent des données importantes pour
le système. Chaque utilisateur élit son Super-pair, qui est
« le serveur central » pour « des noeuds locaux » et peut
communiquer avec d'autres Super-pairs. FastTrack, KaZaA, BitTorrent,
eDonkey/eMule en sont quelques exemples.
|