5. Analyses statistiques
a) Données de phénotypage :
Les traitements statistiques des données ont
été réalisés avec les logiciels XLSTAT et R
Traitement des notations sur rameaux:
- Normalité des résidus: une transformation
logarithmique (Ln) a été effectuée pour stabiliser la
variance. La normalité a été testée par un test
shapiro (p-value<0.01), et l'homogénéité des variances
par un test de Bartlett.
- Pour toutes les variables, les histogrammes de fréquence
ont été réalisés.
- Pour comparer les échantillons de rameaux «
inoculés» et « non inoculés» et entre les
phénotypes de deux parents, un test de student (p-value<0.05) a
été utilisé.
- Pour savoir si certaines variables de résistance
étaient corrélés au sein des populations et entre les
années, le test de Pearson a été utilisé
(P-value<0.05).
- Une analyse du dispositif a été effectuée
avec un modèle linéaire général (ANCOVA) où
les variables expliquées sont (lgc, lge, bs et bi) et les variables
explicatives sont le génotype, le diamètre et la hauteur de point
d'inoculation des rameaux.
- Enfin une analyse en composantes principales (PCA : Principal
component Analysis) a été effectuée pour étudier
simultanément la contribution des
individus observés et la contribution des variables
à la diversité observée.
Traitement des notations sur feuilles :
L'effet du génotype est testé à partir des
notes brutes par le test non paramétrique du chi2. A partir
de la notation individuelle des feuilles, cinq notes synthétiques ont
été établies afin de discriminer les individus de
différentes manières :
- Sevmoy : la moyenne brute des notations
(classe de 0 à 5) par individu,
- Sevmed : la moyenne des notes
transformées en pourcentage de nécrose par une moyenne sur la
médiane de chaque individu,
- Sevreglog : un index calculé
grâce au modèle de régression logistique multinomial
Mlle HADJ BRAHIM Mouna MATERIEL ET METHODES
37
- CribMoy : note de criblure moyenne des
symptômes observés sur feuilles obtenue à partir des
notations de 0 à 3 sur feuilles.
- Cribreglog : note de criblure observée
sur feuilles obtenue à l'aide du modèle de régression
logistique multinomiale basé sur les notes de criblure de 0 à
3.
b) Données de génotypage :
Données des marqueurs SSR dans les populations
biparentales :
Détection de QTLs par analyse de liaison: Les
données phénotypiques de la descendance ont été
reliées aux données de cartographie génétique, afin
de détecter la présence des régions du génome
impliquées dans les caractères mesurés (QTLs). Trois
méthodes d'estimation ont systématiquement été
mobilisées : la régression marqueur par marqueur, l'intervalle
mapping (IM) qui consiste à estimer la présence d'un QTL entre
les 2 marqueurs qui l'encadrent, et le Composite Interval Mapping (CIM) qui
consiste à estimer l'emplacement d'un QTL en s'appuyant sur une plage de
marqueurs qui l'encadre dans une régression pas à pas. La
signification des QTLs est fondée sur le calcul du LOD score. Le LOD
seuil a été fixé par 1000 simulation à une valeur
de 2,3. La position d'un QTL a été estimée d'après
la position de la valeur maximale de LOD (LODmax). L'intervalle de confiance
associée correspond à la projection de la courbe de LOD sur l'axe
des abscisses (longueur du chromosome). L'effet individuel de chaque QTL sur la
variable phénotypique (R2) a été donné
par le modèle.
Les QTL ont été recherchés avec le
logiciel WinQTL cartographer version 2.5(Wang S. et al., 2007)
Données des marqueurs SNP dans le panel de RG
de 76 accessions:
Inférence du nombre de population
ancestrales: elle vise à estimer la structure
génétique d'un ensemble d'individus en rassemblant ces derniers
dans des groupes, sur la base de leurs profils génétiques, elle
permet l'identification de groupe génétiques différents
selon la méthode deltaK (Evanno et al., 2005) grâce au logiciel
STRUCTURE (Pritchard et al., 2000).
Estimation de l'apparentement entre individus:
la matrice des coefficients d'apparentement (compris entre 0 et
1) des individus deux à deux a été obtenue à l'aide
de SPAGeDI (Hardy and Vekemans, 2002).
Mlle HADJ BRAHIM Mouna MATERIEL ET METHODES
38
Détection des QTLs par analyse
d'association:
Afin d'éviter les risques de type I (détection
de fausses associations) et de type II (non détection de vrais
associations), différentes méthodes statistiques d'analyse de
données, pouvant prendre en compte la structure des populations et la
parenté entre individus, ont été
développées, une solution consiste à chercher le
modèle le plus approprié, entre un modèle strictement
basé sur les marqueurs, un modèle linéaire prenant en
compte la structure (Pritchard et al, 2000) et un modèle mixte prenant
en compte la structure et l'apparentement (Meuwissen et al., 2001). Les
modèles testés sur la sensibilité au chancre sur rameaux
et la sensibilité aux criblures sur feuilles ont été : GLM
`simple' (sans correction de structure de la population), GLM'Q' (modèle
simple avec les coefficients de structures comme covariables), et MLM'Q+K'
(correction à la fois de la structure et des différentes
parentés).
La recherche du meilleur ajustement a été faite
à partir de l'appréciation graphique de la concordance entre une
distribution observée et un modèle théorique
représentée par le diagramme probabilités
observées-probabilités cumulées (QQplot).
Le modèle le mieux adapté a ensuite
été utilisé pour la recherche d'associations de tous les
caractères.
Le DL entre marqueurs deux à deux,
représenté par le DL (r2) a été
calculé avec TASSEL 3.0.
|