3.2.2. Composition du réseau de neurones choisi
Ainsi que nous l'avons signalé
précédemment, la composition de notre réseau de neurones
est calquée sur la structure même d'un réseau de neurones
biologiques moyennant une certaine simplification à des fins
adaptatives.
Donc, à l'instar du système visuel humain, notre
réseau de neurones sera organisé en différentes couches
tels que la rétine, le gradient et l'aire de sortie.
Dans le système visuel humain, lorsque l'oeil
perçoit une image, un signal nerveux est transmis au centre du cerveau.
Et, en suivant l'ordre de propagation de ce signal, on constate qu'il devient
de plus en plus abstrait à mesure qu'il s'éloigne de la
première couche (la rétine). Ainsi, un nombre de neurones
élevé sera nécessaire à la première couche
qui est au contact direct avec les données physiques tandis que ce ne
sera pas le cas pour la dernière couche qui, par voie des faits est
éloignée de la réalité.
Dans l'implémentation de notre réseau, nous
allons donc suivre la même logique en réduisant le nombre de
neurones au fur et à mesure que l'on s'éloigne de la
première couche.
a. Le nombre de neurones composant chaque couche
- Nombre de neurones de la rétine :
La rétine étant la couche qui reçoit
directement les données physiques de l'image d'entrée, nous
allons lui affecter le plus grand nombre de neurones. Ainsi, afin de respecter
la résolution, pour une image de dimension 300X300, nous aurons besoin
de 300 X 300 = 90 000 neurones, à raison d'un neurone par pixel.
- Nombre de neurones du gradient :
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement62.png)
57
Considérant que, d'une manière isolé, un
pixel ne donne pas le maximum d'informations sur une image, nous allons chaque
fois regrouper 3X3 pixels afin d'obtenir le minimum d'informations
nécessaires concernant la composition d'une image. Le champ
récepteur d'un neurone du gradient sera donc constitué de 9
neurones de la rétine ; ce qui fait un total de 291 X 291 = 84 681
neurones nécessaires pour constituer la couche du gradient.
- Nombre de neurones de l'aire de sortie :
Cette couche étant la dernière, et suivant
directement celle du gradient, elle aura un champ récepteur
constitué de 84 681 neurones du gradient.
b. L'organisation des neurones dans le réseau
i. L'organisation de neurones de la rétine et du
gradient
Comme nous l'avons signalé précédemment,
chaque neurone du gradient reçoit en entrée la sortie de neuf
neurones de la rétine se trouvant dans son champ récepteur. Et
chacun des neuf neurones est détenteur d'une information sur le pixel
qui se trouvait en face de lui. Cette information est un entier
représentant le niveau de gris du pixel de l'image d'entrée.
ii. L'organisation des neurones du gradient et de l'aire de
sortie
L'aire de sortie étant la dernière couche du
réseau, nous avons un et un seul neurone prenant toutes les sorties des
neurones du gradient en entrée et possédant une et une seule
sortie.
D'une manière synthétique, la configuration
spatiale du réseau se présente comme suit :
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement63.png)
Couche de la Rétine
Couche du Gradient
Couche de l'Aire de sortie
Sortie du réseau
(structure du tableau au format *.html ou
*.doc)
Signaux d'entrée provenant de l'image du tableau
(les 3 composantes RVB)
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement64.png)
58
Fig. 8. Structure spatiale du réseau de
neurones 3.3. Méthodologie de reconnaissance
Tel que annoncé au point 4 du chapitre 2, notre
méthodologie se repartit en deux grandes étapes qui sont :
- le prétraitement de l'image du document et
- l'extraction des caractéristiques du tableau contenu sur
l'image.
|