Dans l'étude comparative de l'approche
centralisée et de l'approche distribuée, nous nous limitons aux
critères suivants :
· Coût des mises à jour :
permet de définir le comportement des deux approches face aux mises
à jour. Dans le cas de l'approche centralisée, les mises à
jour s'effectuent entre le super noeud et les machines. Donc si le nombre de
services augmente de façon régulière alors les mises
à jour deviennent une véritable surcharge pour le super noeud.
Par contre, dans le cas de l'approche distribuée, les mises à
jour se font sur des machines choisies selon des métadonnées
définies. Ce qui permet de réduire la fréquence de mises
à jour.
Marie Hélène Wassa Mballo Page 92
Figure 4.5: Coût de mise à jour dans les
deux approches
Dans la figure 4.5 nous montrons les messages envoyés
lors d'une mise à jour, dans un site nous avons quatre machines. Avec
l'approche centralisée les quatre (4) machines peuvent envoyer
simultanément des messages de mise à jour au serveur, ce qui
entraine une saturation du serveur, car le nombre de
Marie Hélène Wassa Mballo Page 93
machines change de manière dynamique nous pouvons avoir
jusqu'à mille(1000) machines dans un site, il est vrai que nous avons
fixé un pourcentage de saturation, mais le problème de surcharge
demeure car le serveur peut être sollicité 24H sur 24. Il faut
également veiller à mettre en place un réseau à
moindre coût, or les serveurs sont très chers.
Dans le cas distribué une machine envoie des messages
de mise à jour en tenant compte des métadonnées et du
facteur de réplication (voir 4.2.2.3). Ce qui fait que
les machines sont moins sollicitées contrairement à l'approche
centralisée. Une condition posée est que le nombre de
messages qui peut être envoyé à une machine ne doit pas
dépasser la moitié des machines se trouvant dans le
site.
· Coût en réseau : lors
d'une modification d'un service dans le cas centralisé, la communication
se fait uniquement entre machine et super noeud. Ce qui permet de
réduire considérablement le nombre de messages. Alors que dans le
cas distribué, on utilise du multicast. Ce qui va augmenter le flux de
messages qui circulent dans le réseau.
En considérant la figure 4.5, le nombre de messages
réseau de mises à jour envoyé à travers un site par
une machine est de 1 dans le cas centralisé. Tandis que dans le cas
distribué le nombre de messages qui peut être envoyé au
maximum est égal au nombre de machines totales dans un site
divisé par 2.ce nombre de messages change suivant l'ajout ou le retrait
de machines.
Dans le cas d'un site avec 1000 machines, avec l'approche
centralisée une machine n'émet qu'un message de mise à
jour tandis dans le cas distribué une machine peut envoyer 500 messages.
Donc le nombre de messages envoyés dans le cas distribué est 500
fois plus grand que le cas centralisé.
· Temps de réponse pour la recherche
: si un service ne se trouve pas en local alors la requête est
routée dans le site. Le temps mis dans le cas centralisé est plus
important car la requête est routée au super noeud qui peut
être sollicité par plusieurs pairs.
Nous considérons toujours la figure 4.5, à
partir des complexités obtenues, nous pouvons déterminer le temps
qu'il faudra à telle ou telle machine pour mettre en oeuvre
l'algorithme.
Nous allons prendre un exemple avec un site de 1000 machines
; les machines ont un temps de traitement 1GHz ce qui signifie 106
opérations par seconde, nous disposons également d'un serveur de
3GHz utilisé dans l'approche centralisée. L'opération de
mise à jour est une insertion et nous avons
Marie Hélène Wassa Mballo Page 94
calculé dans 4.1.3 la complexité d'insertion qui
est de l'ordre de Cinsrt= O(nlang) + O(nsyst)=1000opérations
dans l'arbre de services du super noeud qui contient la totalité de
l'arbre du site, et 500 opérations pour un arbre de services d'une
machine simple.
Tableau 4.1 : variation du temps de traitement
suivant l'augmentation du nombre de machines
Le tableau 4.1 montre la variation du temps de recherche dans
le super noeud avec l'approche centralisée et une machine quelconque
avec l'approche distribuée. Comme nous l'avons dit
précédemment une machine de l'approche distribuée
reçoit au maximum n/2 messages si n=nombre de machines dans le site.
Nous constatons avec 3000 noeuds il ya une saturation avec l'approche
centralisée contrairement à l'approche distribuée.
L'arbre de services du super noeud est toujours plus grand
que l'arbre de services d'une machine locale, ce qui fait que le temps est
toujours plus grand dans l'approche centralisée.
En résumé, l'approche distribuée est
plus avantageuse, concernant la recherche de services, puisque l'arbre de
services est partagé entre les machines. L'inconvénient
noté pour cette approche est surtout lié au cout réseau,
mais l'utilisation des métadonnées réduit cette limitation
notée. Nous allons mettre dans le tableau ci-dessous la comparaison des
deux approches pour qu'elle soit plus explicite