Annexe A
Cas de données complètes
Il s'agit ici du cas où les données de
durées ont été observé de façon
complète. Précisément, il s'agit du cas où la
durée de réalisation de l'évènement
d'intérêt a été observé pour tous les
individus de l'échantillon. Notons t1,··· , tN
la réalisation de la variable durée pour les N individus de
l'échantillon. L'estimation àS(t) de S(t) est alors
donnée par:
àS(t) = 1 N PN
1ti>t,
i=1
Avec
|
1ti>t =
|
?
?
?
|
1 Si ti > t 0 Sinon
|
Il s'agit de la fraction ou la part des individus qui n'ont
pas encore réalisé l'évènement
d'intérêt avant le temps t.
Cas de durée censurées
Il s'agit du cas où, la variable durée n'a pas
été observée chez tous les individus de
l'échan-tillon. Précisément, certains individus n'ont pas
réalisé l'évènement d'intérêt avant la
fin de l'étude. Si on pose t(1),··· ,
t(m), la réalisation de la variable durée chez
les m individus ayant réalisé l'évè-nement
d'intérêt. Posons respectivement dj le nombre d'individus qui ont
connu l'évènement après l'instant t(j)
et nj le nombre d'individus qui n'ont pas encore réalisé
l'évènement juste avant l'ins-tant. Alors Kaplan et Meier ont
montré que:
àS(t) = 1-J
t(i)<t
|
(1-di ni )
|
La fonction àS(t) est une fonction
décroissante et sa courbe représentative est appelé
courbe de survie de Kaplan-Meier du temps. Sa
représentation permet de voir l'évolution dans le temps de la
probabilité de ne pas être infectée. Pour plusieurs sous
populations d'un même échantillon, les courbes de survie de
Kaplan-Meier permettent de comparer les probabilités dans le temps de ne
pas réaliser l'évènement d'intérêt. La sous
population ayant la courbe de survie de Kaplan-Meier la plus
élevée, est celle qui coure moins de risque de connaitre
l'évènement d'intérêt par rapport aux autres sous
populations.
SANDIE Arsène Brunelle c~IFORD
2013-2014 D
Annexe A
Test de Log-rang
Les courbes de survie de Kaplan-Meier, nous permet non
seulement de décrire la probabilité de ne pas connaitre
l'évènement d'intérêt dans le temps, mais aussi de
comparer la survie à l'évènement d'intérêt
entre plusieurs sous populations d'un même échantillon. Les
différences observées sur les courbes de Kaplan-Meier peuvent
être dues aux fluctuations d'échantillonnages dès lors il
est nécessaire d'utiliser une procédure de test statistique pour
effectivement comparer les courbes de survies de Kaplan-Meier de plusieurs
sous-populations distinctes. Plusieurs procédure de tests (Log-rang,
Breslow, Tarone-Ware, Gehan, Peto et Prentice) ont été
développées à cet effet. Toutefois, celle que nous
utiliserons pour effectuer nos analyses est le test du Log-rang au seuil de
á = 5%. Considérons alors k sous populations
distinctes et notons àS1(t),
· · · àSk(t) les
courbes de Kaplan-Meier respectives.
Hypothèse.
H0 : àS1(t) = ·
· · = àSk(t);
H1 : i, j tel que i =6 j
et àSi(t) =6
àSj(t).
l'hypothèse H0 traduit que les k
sous-populations ont statistiquement une même probabilité
dans le temps de survivre à l'évènement
d'intérêt. Par contre H1 signifie qu'il existe au moins
deux sous-populations qui ont des courbes de Kaplan-Meier différentes.
Rejeter l'hypothèse nulle revient à dire que les courbes de
survies des k sous populations ne sont pas statistiquement tous
égales.
Analyse explicative
Il existe plusieurs modèles statistiques pour l'analyse
de durée, on peut citer entre le modèle sémi
paramétrique de cox, le modèle de durée de vie
accélérée, le modèle additif de Aelen, le
modèle à risque compétitif et bien d'autre. Chaque
modèle ayant des spécificités.
Le modèle de Cox
Le modèle de Cox, est le modèle le plus populaire
et le plus utilisé dans l'analyse de survie, il permet d'exprimer la
fonction de hasard en fonction des variables explicatives.
SANDIE Arsène Brunelle c~IFORD
2013-2014 E
|