CHAPITRE 3: ETUDES EMPIRIQUES SUR LES METHODES DE
LISSAGE DES TABLES DE MORTALITE
Les estimations par âge des quotients annuels ou
quinquennaux de décès forment une courbe de mortalité qui
se révèle en général assez
irrégulière. Ces aspérités sont dues aux
fluctuations d'échantillonnage et ne sont pas représentatives de
la réalité. Entre 0 et 10 ans, à cause la forte
mortalité infantile dans les pays en voie de développement, on
assiste à une décroissance des quotients de mortalité. Les
taux de décès sont si élevés dans la
première année de la vie que l'on atteint parfois dans certains
pays d'Afrique le ratio d'un décès pour dix enfants. Dans la
logique à partir de 10 ans, les quotients évoluent graduellement
avec l'âge. Au niveau des pays développés, nous avons la
fameuse « bosse accidentelle » entre 19 et 35 ans à cause des
accidents de la route et du taux élevé de suicide. De nombreuses
méthodes existent pour estimer les quotients de mortalité. Les
estimations corrigées qu' elles produisent progressent
régulièrement avec l' âge et pour cette raison, sont
appelées estimations lissées des taux de décès. Les
méthodes de lissage permettent un ajustement assez fidèle aux
données d' expérience.
Nous présentons quelques catégories de
méthodes permettant d' obtenir des estimations lissées des taux
de décès et ainsi, de construire une table de mortalité
:
· Les modèles paramétriques
· Les modèles relationnels
Avant d'aborder les différents modèles,
certaines notations et définitions sont utiles pour la
suite de notre travail.
Encadré n°3 : Notations et
définitions
Les probabilités de survie et de
décès
Pour tout individu d'âge x, nous notons Tx la variable
aléatoire représentant sa durée de vie restante.
En toute généralité, on définit
alors les probabiités de survie apx et de décès aqx pour
l'un de ces individus d'âge x pendant une durée a.
On a :
apx = Pr [Tx >a] et aqx = Pr [Tx ~a]
apx représente la proportion d'individus qui survivront
jusqu'à l'âge x+a et aqx représente la
proportion d'individus qui mourront entre l'âge x et x+a. Nous avons
également la relation
apx + aqx =1.
Le taux brut de mortalité
C'est le rapport du nombre annuel de décès
observés dans une population à l'effectif moyen de cette
population au cours de la période d'observation.
Le taux instantané de
décès
Appelé également force de mortalité
(traduction littérale de l'anglais), il représente le taux de
décès par unité de temps au voisinage de l'âge x
ux = -S'x/Sx avec Sx le nombre de survivants à
l'âge x.
En adoptant l'hypothèse de constance par morceaux des
taux instantanés de mortalité pour la répartition des
décès sur l'année (l'individu ni ne vieillit ni ne
rajeunit sur l'intervalle d'âge [x, x+1]), nous obtenons un lien direct
entre ces deux taux par :
ux = -ln (1-qx)
Nous avons également : qx =1-exp(-ux).
L'espérance de vie
Un concept fondamental est la durée de vie moyenne
restante à l'âge x, notée ex. Il s'agit de l'une des
caractéristiques les plus couramment utilisées pour rendre compte
du phénomène de la mortalité. L'espérance de vie
à l'âge x ou durée de vie moyenne au-delà de
l'âge x, pour les survivants à l'âge x est définie
par :
ex =E (Tx) =
Sx+ådu
1 ~+8
Sx å=0
L'intégrale figurant dans cette formule donne le nombre
moyen d'années vécues au-delà de l'âge x par les
individus ayant atteint cet âge, et la division par Sx donne donc le
nombre moyen d'années restant à vivre pour chacun des individus
ayant atteint l'âge x. La vie médiane
La vie médiane ou vie probable, est l'âge probable
qu'une personne a autant de chance d'atteindre que de ne pas atteindre.
Cette notion peut également être
interprétée comme l'âge où la moitié des
individus présents à la naissance (racine de la table) sont
décédés.
3.1- La modélisation paramétrique
La modélisation paramétrique repose sur
l'hypothèse que la courbe de mortalité peut être
représentée par une fonction mathématique de quelques
paramètres. Le choix du modèle est déterminant.
Démographes et actuaires, ont étudié de nombreux
modèles potentiels et identifié ceux qui arrivent le mieux
à retracer les caractéristiques fondamentales et permanentes des
courbes de mortalité.
Un avantage certain des modèles paramétriques
est qu'ils permettent, de par leur construction, d'étendre l'estimation
de quotients de mortalité aux âges situés en dehors de la
plage d'observation à condition toutefois que la fonction ait
été correctement choisie, c'est à dire si des
études statistiques ont démontré son adaptabilité
à la plage cible.
Nous présenterons dans ce chapitre quelques
modèles paramétriques, en commençant par la très
ancienne et classique loi de Gompertz. Viennent ensuite les lois de Weibull, de
Makeham, de Heligman-Pollard et finalement la fonction logistique de
Kannisto.
+ Loi de Gompertz (2 paramètres)
Sur de nombreuses populations, il a été
observé que le taux instantané de mortalité augmente d'une
manière quasi-exponentielle avec l'âge. Gompertz (1825) a
proposé un modèle paramétrique simple qui traduit cette
tendance :
ux= BCx , avec B>0, C>1
· B varie en fonction du niveau de mortalité,
· C mesure l' augmentation du risque de décès
avec l'âge.
Cette fonction peut permettre de modéliser la courbe
de mortalité au-delà de 30 ans environ. Il faut cependant savoir
qu' elle tend à sous-estimer la mortalité avant 40 ans et
à la surestimer au-delà de 80 ans.
B
Après transformation de ux, on obtient px =exp
(bCx )= 1-qx , avec b= - (C-1)
lnC
+ Loi de Makeham (3 paramètres)
Pour améliorer l'évaluation de la mortalité
des jeunes adultes (avant 40 ans environ), Makeham (1960) a enrichi la formule
de Gompertz d'un paramètre :
ux= A+BCx , avec A>0, B>0, C>1
On considère usuellement que le paramètre A rend
compte de la mortalité environnementale (parfois appelée
mortalité extérieure à l'individu), indépendante de
l'âge.
Cette interprétation peut poser question car il arrive
d'obtenir des valeurs négatives pour A. Après transformation de
ux, on obtient px = exp-[A+(B(C-1)Cx)/lnC]
=1-qx.
+ Loi de Weibull (2 paramètres)
Weibull (1951) a proposé un modèle pour
décrire les défaillances techniques d' un système. Des
analogies pouvant être faites entre les défaillances du corps
humain et celles d' un système, ce modèle a été
transposé à l' étude de mortalité. On pose alors
:
ux= axb , où a >0 ,B>1
ce qui équivaut à ln ux=ln(a) + b ln(x) (la
relation entre ln ux et ln(x) est linéaire).
+ Le modèle de Heligman-Pollard (8
paramètres)
Cette loi a été introduite par L.Heligman et J.H.
Pollard en 1980. Elle présente l' avantage de comporter un terme
spécifique à la modélisation de la mortalité
infantile. La formule est :
Où : modélise la mortalité infantile
modélise la mortalité dite accidentelle ou
environnementale
modélise la mortalité aux âges adultes, hors
mortalité environnementale, c'est-àdire la mortalité due
au vieillissement.
On peut montrer dans ce modèle que si la force de
mortalité tend asymptotiquement vers une droite, alors elle a une forme
exponentielle dans le modèle de Gompertz et une puissance de l'âge
dans le modèle de Weibull. Ainsi, aux âges les plus
élevés, le modèle de Gompertz donnera usuellement des
estimations supérieures à celles du modèle de Weibull qui
serontelles mêmes plus élevées que celles du modèle
Heligman-Pollard. L'une des grandes insuffisances de modèle
réside au niveau du nombre important de paramètres. Cette
extension a tendance à jouer défavorablement sur la robustesse de
la formule : les paramètres
deviennent difficilement interprétables et le
modèle ne donne pas une description générale et stable des
courbes de mortalité.
+ Le modèle logistique et l'approximation de
Kannisto (4 paramètres)
Les trois premiers modèles présentés
précédemment (Gompertz, Makeham et Weibull) impliquent que la
probabilité de décès tende asymptotiquement vers 1 quand
l'âge augmente. Une autre possibilité est que la
probabilité de décès augmente ave l' âge mais tende
vers une limite inférieure à 1 : c'est l'hypothèse qui est
contenue dans le modèle logistique de Kannisto.
D'après ce modèle, il n'existe pas de limite
maximale de durée de vie humaine étant donné qu'à
aucun âge, la probabilité de survivre jusqu'à l'âge
suivant ne devient négligeable. Le modèle logistique
présente donc une approche relativement différente des
précédents quant à la mortalité aux âges les
plus élevés. Ainsi une divergence entre les modèles est
toujours observée aux âges très élevés.
Le modèle logistique repose sur l'hypothèse que le
taux instantané de mortalité est une fonction logistique de
l'âge. Le modèle le plus général comporte 4
paramètres :
b cx
exp()
ux = a+
1exp()
+dcx
Il inclut le modèle de Makeham, que l'on retrouve quand d
= 0.
Le modèle logistique a été initialement
utilisé par Perks (1932). Depuis plusieurs justifications
théoriques ont été élaborées, ce qui lui
donne un intérêt particulier même si ces théories ont
chacune leurs limites et son forcement incomplètes :
La première théorie est celle du « fixed
frailty model » de Beard (1971), Vaupel et Al. (1979). Elle montre que le
modèle logistique découle d'une modélisation simple de la
mortalité dans une population hétérogène : la
mortalité de chaque individu est supposée suivre une loi de
Makeham.
3.2- Les modèles relationnels
Les modèles relationnels sont des modèles dans
lesquels le taux de mortalité n' est pas fonction uniquement de
l'âge, mais du taux de mortalité donné par la table de
référence et /ou de l'âge.
Il s'agit de rapprocher les taux de mortalité bruts
à ceux issus d'une table connue, construite à partir d'une
population ayant des caractéristiques similaires et de transformer cette
table de référence pour aboutir à celle du groupe
visé.
+ Le modèle de Brass
Le plus célèbre d' entre eux est celui de Brass
(1971) qui utilise les modèles logit. Le recours à ce type de
transformation permet d'obtenir une quantité non contrainte (alors que
q? [0,1], logit (q) ? R).
Il admet l'existence d'une relation linéaire entre les
logits des quotients de mortalité cumulés de deux tables pour un
même âge.
Dans ce modèle les probabilités de
décès xqa sont liées à un jeu de
probabilités de référence
xqa ref par la relation :
logit (xqa) = e1 + e2 logit (xqa ref ), x = a, a+1, ,w,
Où logit (q) = ln (q/ (1-q)).
3.3- Orientations
La partie suivante sera le lieu d' application de toutes les
techniques et méthodes exposées précédemment. Elle
nous permettra de préciser le type de table que nous utiliserons ainsi
que la méthodologie d'analyse pour nos quotients de mortalité.
Cette partie nous a permis de faire un état des lieux
sur l'utilisation des tables de mortalité en Afrique et en Europe. Une
distinction a été faite entre les tables existantes tout en
montrant leur utilisation selon le cas d' espèce. Le second chapitre
relatif aux lis sages a été le lieu d'exposer les
différentes méthodes de régression possibles.
|