2.3 Les méthodes de lissage paramétriques
ou non-paramétriques
Elles permettent un ajustement assez fidèle aux
données d'expérience. Contrairement aux modèles
paramétriques, elles ne reposent pas sur l'hypothèse que la
courbe de mortalité a une forme connue a priori et, à ce titre,
ne sont pas prévues pour obtenir une estimation des taux de
mortalité en dehors de la plage de lissage. On peut même noter
qu'une extrapolation est par nature impossible pour les méthodes de
lissages non-paramétriques étant donné que les taux de
mortalité ne sont pas représentés à l'aide d'une
fonction mathématique.
2.4 Modèles relationnels
Ils partent du même principe que la modélisation
paramétrique, à la seule différence que le taux de
mortalité est désormais exprimé en fonction non plus de
l'âge, mais du taux de mortalité donné par une autre table.
Ainsi, une table de mortalité connue est prise comme
référence et il est supposé que l'on peut, à l'aide
d'une fonction comprenant un petit nombre de paramètres, transformer
cette table de mortalité de référence pour obtenir celle
de la population étudiée.
Les modélisations paramétriques et les
méthodes relationnelles permettent d'estimer les taux de
mortalité même en dehors des plages d'âge
d'expérience ; ce qui est une propriété
intéressante. Il faut toutefois rappeler que ces approches font prendre
un risque de modèle.
Pour limiter ce risque, nous allons analyser graphiquement les
taux bruts de mortalité avant de sélectionner le modèle
paramétrique ou relationnel.
Quand il y a trop de fluctuations dans les estimations brutes,
il est intéressant d'effectuer un lissage non-paramétrique,
préalablement à l'analyse graphique.
16
Chapitre I : Les Risques liés à
l'assurance-vie
A l'inverse, les méthodes de lissage
paramétrique ou non-paramétrique permettent une plus grande
fidélité dans l'ajustement aux taux bruts mais ne sont pas
conçues pour être utilisées en dehors de la plage
d'estimation.
Soulignons également l'intérêt des
méthodes de lissages paramétriques ou non paramétriques
pour le lissage en deux dimensions.
2.5 La modélisation paramétrique
La modélisation paramétrique repose sur
l'hypothèse que la courbe de mortalité peut être
représentée par une fonction mathématique.
Démographes et actuaires ont étudié de
nombreux modèles potentiels et identifié ceux qui sont les plus
adaptés à retracer ces caractéristiques.
Une attention particulière doit être
accordée au nombre de paramètres contenus dans le modèle.
En effet, si l'augmentation du nombre de paramètres permet un meilleur
ajustement aux taux bruts, elle se fait au détriment de la robustesse du
modèle, c'est-à-dire de sa capacité à
refléter des caractéristiques générales des courbes
de mortalité. Un modèle qui n'est pas robuste, donne de bons
estimateurs s'il est adapté aux données. En revanche, s'il n'est
pas approprié, il peut donner de très mauvaises estimations.
Nous présentons dans ce chapitre quelques
modèles paramétriques, en commençant par l'une des plus
anciennes la loi de Gompertz. Viennent ensuite les formules de
Makeham, de Weibull, finalement la fonction logistique et la
formule de Kannisto.
Ces modèles paramétriques ont été
largement validés pour des données de population
générale.
Pour une utilisation sur des données d'assurance, il
est important de s'assurer au préalable que la population
étudiée est relativement homogène. Citons, comme exemple
de source d'hétérogénéité, la
sélection effectuée à la souscription du contrat : la
sélection peut influencer le risque de décès
différemment selon l'âge de l'assuré. Ainsi la courbe de
mortalité sera déformée de façon différente
selon les âges. Plus généralement, les modèles
paramétriques décrits ici s'appliquent à des tables
unidimensionnelles.
Enfin, il ne faut pas négliger le risque qu'un
modèle ne soit pas adapté aux données. Pour éviter
cet écueil, il est nécessaire de procéder à toutes
les vérifications usuelles, à commencer par une analyse graphique
des estimations brutes des taux de décès en fonction de
l'âge pour déterminer si la fonction choisie pour la
modélisation paramétrique semble acceptable. Il est
également nécessaire de procéder aux vérifications
usuelles de la qualité d'une régression.
17
Chapitre I : Les Risques liés à
l'assurance-vie
a) Modèle de Gompertz (2 paramètres)
Sur de nombreuses populations, il a été
observé que le taux instantané de mortalité augmente d'une
manière quasi-exponentielle avec l'âge. Gompertz (1825) a
proposé un modèle paramétrique simple qui traduit cette
tendance : ux = B * Cx avec
B>0, C>1
> B varie en fonction du niveau de
mortalité,
> C mesure l'augmentation du risque de décès
avec l'âge.
Cette fonction peut permettre de modéliser la courbe de
mortalité car le taux augmente de façon exponentielle Il faut
cependant savoir qu'elle tend à sous-estimer la mortalité avant
40 ans et à la surestimer au-delà de 80 ans.
La formule de Gompertz rend compte sous la forme
ux = B * Cx du seul processus
de vieillissement, mais il négligeait le faite qu'une partie des
décès qui surviennent est due à des accidents. (Petauton
1996).
À l'instar de la loi normale, il s'agit d'une
modélisation de phénomènes naturels qui s'applique
à diverses situations en marketing par exemple, elle est utilisée
pour connaitre la durée de vie d'un produit sur le marché
nommée aussi courbe de vie, ou bien dans le domaine des ressource
humaines pour estimer l'efficacité d'une formation courbe
d'apprentissage, etc.
b) Modèle de Makeham (3 paramètres)
L'idée de Makeham est d'améliorer
l'évolution de mortalité, pour y parvenir il a ajouté
à la loi de Gompertz un paramètre a indépendant de
l'âge, appelée mortalité extérieure à
l'individu. Pour améliorer l'évaluation de la mortalité,
Makeham (1960) a enrichi la formule de Gompertz d'un paramètre
ux = A + B * Cx Avec A>0,
B>0, C>1
On considère usuellement que le paramètre A rend
compte de la mortalité accidentelle, indépendante de l'âge.
Cette interprétation peut poser question car il arrive d'obtenir des
valeurs négatives pour A.
La formule de Makeham ne résout pas le problème
de la surestimation du risque aux âges supérieurs à 80 ans
déjà rencontré avec la formule de Gompertz,
l'utilisation de ce modèle sera liée à l'âge limite
d'assurance du produit étudié
Ces formules ont pendant très longtemps eu la faveur
des compagnies d'assurance du fait des propriétés simples
qu'elles présentent dans les calculs d'assurances sur plusieurs
têtes (Petauton 1996)
18
Chapitre I : Les Risques liés à
l'assurance-vie
c) Modèle de Heligman-Pollard (8
paramètres)
Cette loi a été introduite par L. Heligman
et J.H. Pollard. Ce modèle, composé de trois courbes et de
huit paramètres, prend en considération la mortalité
infantile.
*+ = H~+~I)J ( K L e3N(:~ +3:1 O)Z (
PQ+
1 ( PQ+
H(+~I)J :La Première composante de la
fonction Heligman-Pollard, représente la mortalité
infantile C<0, le premier composant diminue rapidement.
K L e3N~:~ +3:n O)2 : La
deuxième partie représente la mortalité accidentelle
Makeham
PQ+/1 ( PQ+: La
dernière composante représente la mortalité due au
processus de vieillissement introduite par Gompertz. Contrairement
à cette dernière, cette composante est représentée
par un modèle logistique.
On peut montrer que, dans ce modèle, la
mortalité tend asymptotiquement vers une droite, alors qu'elle a une
forme exponentielle dans le modèle de Gompertz.
Ainsi, aux âges les plus élevés, le
modèle de Gompertz donnera usuellement des estimations
supérieures à celles du modèle de
Heligman-Pollard.
d) Le modèle logistique et
l'approximation de Kannisto (de 2 à 4 paramètres)
Les trois premiers modèles présentés
précédemment (Gompertz, Makeham, Weilbull) impliquent
que la probabilité de décès (qx), tende
asymptotiquement vers (1) quand l'âge augmente.
Une autre possibilité est que la probabilité de
décès augmente avec l'âge mais tend vers une limite
inférieure à (1). C'est l'hypothèse qui est contenue dans
le modèle logistique (le modèle de Kannisto est une
simplification du modèle logistique), où :
G * UV+
D'après ce modèle, il n'existe pas de limite
maximale à la durée de vie humaine étant donné que,
à aucun âge, la probabilité de survivre jusqu'à
l'âge suivant ne devient négligeable.
Le modèle logistique présente donc une approche
relativement différente des précédents modèles
quant à la mortalité aux âges les plus
élevés.
Ainsi une divergence entre les modèles est toujours
observée aux âges très élevés (même
avec un ajustement très similaire sur la plage 80- 100 ans, on observe
une divergence au-delà de 100 ans).
19
Chapitre I : Les Risques liés à
l'assurance-vie
Le modèle le plus général comporte 4
paramètres : ;+ = H ( I*WJ2 HYUZ H > 0, G >
0. Il
7~X*WJ2
inclut le modèle de Makeham, dans le cas où
(D=0). 2.6 Lissages paramétriques
Le lissage paramétrique consiste à trouver une
courbe paramétrique qui représente bien l'évolution des
taux de décès en fonction de l'âge. Contrairement à
la modélisation paramétrique, il ne s'agit pas de postuler a
priori une forme bien précise pour la courbe de mortalité mais de
déterminer, celle qui s'adapte le mieux aux taux bruts parmi une famille
de fonctions mathématiques.
Les fonctions utilisées doivent être suffisamment
flexibles pour permettre d'obtenir une courbe de taux lissés qui soit
proche de celle des taux bruts.
Nous présentons ici deux familles de fonctions qui
peuvent être utilisées pour effectuer un lissage
paramétrique. Nous commençons par les splines. Pour effectuer un
lissage paramétrique, on a recours aux techniques de régression
linéaire généralisée quand la variable
expliquée est une fonction linéaire des variables explicatives,
ou bien aux techniques de régression non linéaire quand cette
fonction n'est pas linéaire.
Dans ce dernier cas, il est fait appel à des techniques
itératives qui nécessitent de choisir des valeurs initiales pour
les paramètres de la fonction. Le choix de ces valeurs initiales est un
élément crucial car elles doivent être
suffisamment proches de leurs vraies valeurs pour que la procédure de
régression converge.
a) Méthode des splines :
Le terme spline tire son origine d'une technique
utilisée autrefois pour construire les coques des navires. Cette
technique permettait d'obtenir, entre les points d'attache, la forme la plus
lisse possible. Les mathématiciens ont étudié cette forme
à partir de 1946 et en ont dérivé la fonction spline. Dont
les restrictions aux intervalles [\ , [\+7
, ] = 0, ... ,1
sont des polynômes de degré _ > 0
par convention [6 = 8
et [\ = (8
Lissage par un spline L'ajustement d'une fonction spline aux
estimations brutes des taux de décès se fait par la
méthode des moindres carrés pondérés (minimisation
de la somme pondérée des écarts quadratiques entre les
estimations brutes et lissées.
aC = ? c+ *
+ +g+\?h i+ "
*j+~k. def
Pour les poids, on peut par exemple utiliser les effectifs
sous risque ou l'inverse des variances des estimateurs bruts.
Dans l'objectif de minimiser SC, le déplacement d'un
noeud est parfois plus intéressant que l'ajout d'un noeud
supplémentaire. Pour déterminer les valeurs des noeuds, plusieurs
approches sont envisageables.
20
Chapitre I : Les Risques liés à
l'assurance-vie
Une première consiste à les fixer
préalablement à la minimisation et à comparer les
résultats obtenus avec plusieurs choix différents. Une analyse
graphique de la courbe de mortalité peut aider à
déterminer les valeurs et le nombre de noeuds. Une approche alternative
serait d'inclure les valeurs des noeuds dans les paramètres de la
minimisation.
b) Méthode des moyennes mobiles
pondérées (MMP)
La méthode des moyennes mobiles centrées
symétriques pondérées, est l'une des premières
méthodes de lissage à avoir été
développée.
Dans ce cadre, citons en particulier, les travaux d'E.L.
De Forest dans les années 1870. La méthode MMP est assez peu
utilisée aujourd'hui car des méthodes plus efficaces lui ont
succédé.
La valeur lissée du taux de mortalité est
obtenue en prenant la moyenne mobile pondérée de 2[ ( 1
des estimations initiales consécutives (taux de
décès estimés bruts), indicées de x "
]
m
La formule générale pour un lissage de
degré 2[ ( 1 est i+ = ? Z\
*
\g3m *j+~\
c) Méthode de Whittaker-Henderson
Cette méthode de lissage doit son nom à E. T.
Whittaker (1923), et à R. Henderson (1924). La
méthode de Whittaker-Henderson consiste à rechercher le meilleur
compromis entre l'adéquation aux données brutes et la
régularité de la courbe de mortalité. Les taux de
mortalité lissés sont obtenus en minimisant la mesure n =
o ( )a, où :
· o = ? c+ *
+ +g+\?h (i+ "
*j+~k, o est la somme
pondérée des carrés des écarts
entre def
les valeurs lissées et les valeurs brutes, elle mesure
la fidélité des taux de mortalité lissés aux taux
bruts. Plus les taux lissés se rapprochent des taux bruts, plus la
valeur de o diminue.
· a = ? ~pq *
i+)2
+ def3q , S est la somme des
carrés des différences d'ordre z des
+g+\?h
taux lissés, elle permet d'évaluer la
régularité de la courbe lissée. Plus l'aspect de la courbe
est régulier, plus la valeur de S diminue.
· z est un entier positif. En pratique, les
valeurs les plus utilisées sont z = 2, 3 ou 4.
· h est un réel positif qui permet de
contrôler l'influence que l'on souhaite donner à chacun des deux
critères précédents. Plus h est grand, plus la
minimisation porte sur le terme S et impose à la courbe une
allure régulière. Plus h est petit, plus la minimisation
accorde de l'importance au terme F et impose à la courbe
lissée de se rapprocher des données brutes. Soulignons que si 0 =
h, aucun lissage n'est effectué.
· c+ sont les poids
donnés à chaque âge
(c+=0).
21
Chapitre I : Les Risques liés à
l'assurance-vie
|