2.5.2. Validité,
performances diagnostiques et choix décisionnels
L'évaluation des méthodes biocliniques et
des diagnostics clinique de la cirrhose hépatique et de
l'hépatocarcinome a été réalisée par leur
validité interne, la mesure de l'accord (efficience ou concordance) et
le choix décisionnel à l'aide des courbes ROC (Receiver Operating
Curves) (22). Cette valeur diagnostique des tests biocliniques a
été mesurée en comparaison avec le diagnostic réel
apporté par le test de référence ou Gold Standard
représenté par l'échographie abdominale en utilisant des
tableaux à quatre cases (contingences ou quarré latin).
La validité interne était
considérée comme la capacité de poser cor-
rectement le diagnostic de cirrhose hépatique et
d'hépatocarcinome sous forme d'indices suivants :
- la sensibilité ;
- la spécificité.
Les indices de décision médicale étaient
représentés par les valeurs prédictives (risque
d'être malade ou de ne pas être malade).
La validité externe était
définie par la reproductibilité de plusieurs tests de diagnostic,
le taux de référence, la proportion d'agrément, indiquant
la probabilité d'obtenir les mêmes résultats.
Pour ce faire, la base des formules a
été établie à partir du quarré
latin (Tableau 1).
Tableau 1. Quarré latin
Test diagnostique Test de
référence
*examen clinique échographie
abdominale Totaux
*biologie sanguine
+
-
Test + a=vrai positif
b=faux positif a+b
VP
FP
Test - c=faux négatif
d=vrai positif c+d
FN
VN
Totaux a+c
b+d a+b+c+d
VP
a
* Sensibilité = =
;
VP + FN a +
c
VN
d
*Spécificité = =
;
VN +FP d +
b
*Rapport de vraisemblance (Likelihood Ratio) :
Sensibilité
LR+ =
;
1 -
Spécificité
1 - Sensibilité
LR- =
;
Spécificité
VP
a
*Valeur Prédictive Positive, VPP = =
;
VP +
FP a + b
VN
d
*Valeur Prédictive Négative, VPN =
= ;
VN +
FN d + c
*Proportion de Classification Correcte (PCC) ou
reproductibilité (précision,
a+d
concordance brute observée, statistique Kappa) =
= Po ;
a+b+c+d
*Concordance attendue sur l'hypothèse
d'indépendance :
(a+c)(a+b)+(b+d)(c+d)
= Pa ;
(a+b+c+d)²
Po-Pa
*Le coefficient Kappa = ;
1- Pa
*Proportion d'agrément entre deux observateurs :
a
si résultat anormal, P+ =
;
a+b+c
d
si résultat normal, P- =
;
b+c+d
* Indice de Youden : l'addition de la sensibilité
et de la spécificité d'un seuil à
risques (lignes de partage) a conduit à l'Indice de
YOUDEN :
Y= (Sensibilité +
Spécificité)-1.
L'estimation du cout-éfficacité des tests
cliniques explorés se référait à la proportion des
patients référés par le clinicien à
l'échographie abdominale participait au coût à supporter
par elles-mêmes, la famille ou l'l'employé.
Par rapport à cette notion, l'importance des groupes de
patients Vrais Positif, Faux Positifs et Faux Négatifs, était un
élément qui rentrait dans l'estimation de l'efficacité
prédictive d'un test clinique (ou diagnostic clinique). Pour cette
raison, les indices suivants ont été définis :
- l'Indice de Vraie Positivité (IVP) était
égal au nombre des patients référés divi-
sé par celui des patients Vrais Positifs (expression du
Rapport Cout-efficacité
d'un test prédicteur de la maladie). Plus le nombre des
patients Vrais Positifs
était élevé, plus l'IVP diminuait et plus
le test clinique prédicteur exploré était
efficace pour le diagnostic de la maladie ;
- l'Indice de Fausse Positivité (IFP) était
égal au nombre des patients référés
divisé par celui des patients Faux Positifs. A
l'inverse de IVP, l'IFP exprimait
une charge injuste pour les patients qui étaient
inutilement référés et pour le
système de soutien (Famille, Amis, Entreprises). Plus
le nombre des patients
Faux Positifs était élevé, plus l'IFP
diminuait et plus la spécificité du test
clinique était faible pour le diagnostic de la
maladie.
Ne connaissant pas le nombre de patients non
référés à l'échographie, l'indice de Fausse
Négativité et l'indice de Vraie Négativité n'ont
pas été calculés.
La concordance était qualifiée d'excellente pour
un coefficient K entre 0,81 et 1, de bonne pour les valeurs 0,61 à 0,80,
de moyenne pour les valeurs 0,41 à 0,60, de faible entre 0,21 et 0,40,
et de mauvaise entre 0 et 0,29
(23-25).
Les tests statistiques ont été conclus avec un
risque de première espèce de 0,05. Les intervalles de confiance
ont été calculés avec le même risque de 5% (IC
95%)
|