2.3 Interprétation et validation d'un modèle
QSPR/QSAR
La validation du modèle QSPR/QSAR se fait après
avoir établi un certain ensemble d'étapes de
développement. Ces étapes importent la définition de la
base des données, le choix et le calcul des descripteurs, établir
la corrélation entre différents descripteurs et analyse
statistique. Une fois ces étapes sont faites, le modèle doit
être interprété en analysant tous les paramètres
statistiques de ce modèle en se basant sur la méthode d'analyse
adoptée, sa qualité doit être bien étudiée,
cette qualité est vérifiée pour une validation. Sa
robustesse, c'est-à-dire l'influence des composés de la
série d'apprentissage sur le modèle est estimée par des
méthodes de validation interne. Afin d'estimer son pouvoir
prédictif, des données expérimentales
supplémentaires sont nécessaires afin de déterminer la
capacité du modèle à prédire ces valeurs c'est ce
que l'on appelle validation externe. Enfin, il est important de savoir quel
type de molécules utilisées avec quel modèle. On parle
alors de domaine d'applicabilité.
2.3.1 Validation interne
Dans le passé, la validation interne d'un modèle
QSPR/QSAR a été réalisée en utilisant la validation
croisée LOO (Leave One Out) ou LMO (Leave Many Out) qui est
quantifiée par le
coefficient (L. Zhang, 2008). Ce processus consiste à
extraire un certain nombre k de molécules du jeu initial à N
molécules et à construire un nouveau modèle avec les (N-k)
molécules restantes à l'aide des descripteurs choisis (seules les
constantes de la régression changent). Ce processus est ensuite
réitéré pour retirer et prédire les valeurs de
toutes les molécules de la série d'apprentissage. En fonction du
nombre de molécules retirées à chaque itération, on
parlera de LOO ou de LMO selon qu'une ou plusieurs molécules est (sont)
retirée(s). Dans ces dernières années, d'autres
méthodes sont utilisées pour faire la validation interne, tel que
la hasardisation de la réponse (Y-Randomization) (L. He, 2005).
Cependant, la validation interne a montré son insuffisance pour
étudier le pouvoir prédictif d'un modèle QSPR/QSAR. Cette
insuffisance de prédiction a permet l'adoption de la validation externe
du modèle comme une norme et une partie obligatoire dans la
modélisation basée sur les méthodes QSPR/QSAR (Tropsha,
2003).
2.3.2 Validation externe
En arrivant à l'étape de validation par cette
méthode, notre objectif principal est de prédire la
propriété et l'activité d'une série de
molécules appelée généralement série de
test. La validation externe doit être effectué dans le cadre d'une
prévision des composés issus d'un ensemble n'ayant pas
été utilisé dans l'élaboration du modèle.
Elle est caractérisée par les
paramètres (test), (test). Récemment plusieurs
études (Golbraikh, 2002) ont montré l'insuffisance de ces
paramètres pour vérifier le pouvoir prédictif des
modèles QSAR et QSPR. Par conséquent, d'autres paramètres
doivent être vérifiés pour cet objectif. Ces
paramètres sont connus sous le nom « critères de validation
externe » ou souvent appelés « critères de Trophsa
».
3. 13
Applications
Les applications des méthodes QSPR/QSAR sont multiples
à savoir la prédiction des propriétés
physico-chimiques, activités biologiques, etc.
Propriété physico-chimiques :
> Point d'ébullition, point de fusion, densité,
température critique.
> Solubilité.
> Pression de vapeur ...
Activités biologique :
> Anti VIH.
> Anti cancer.
> Anti Covid sars.
> Anti Malaria.
> Anti inflammatoire ...
Autres propriétés/activités :
> Prédiction de la toxicité aquatique des
composés chimiques.
> Toxicité des nanoparticules.
> Toxicité des pesticides et des colorants.
> Concentration micellaire critique.
> Propriétés inhibitrices de corrosion.
> Conception des médicaments et de nombreux autres
produits tel que les parfums ;
les colorants et les produits de la chimie fine ...
4. Conclusion
Dans le premier chapitre, nous avons s'intéressé
à la modélisation avec les méthodes QSAR/QSPR et la
classification de différents descripteurs utilisés pour exprimer
l'activité biologique de manière quantitative et le passage
à des expressions mathématiques qui peuvent utilisés comme
moyen prédictif de la réponse biologique. Dans le chapitre
suivant, nous révisons les approches adoptées dans la recherche
de nouveaux médicaments de "SARS-CoV-2".
14
|