WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Prédiction de durée de séjour hospitalier en gynécologie basée sur le machine learning: cas de quelques hôpitaux au sud-Kivu


par René CUBAKA ZAHINDA
Institut Supérieur Pédagogique de Kaziba - Licence 2022
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Chapitre 1

Les systèmes d'informations

hospitaliers et la gestion hospitalière

1.1 Introduction

Actuellement, les établissements de soins font face à une forte croissante du nombre de cas d'hospitalisation, et ceci, c'est depuis l'apparution de la pandémie à COVID-19 où le nombre d'hospitalisation a accru dans plusieurs pays du monde [7]. Pour ce faire, il est donc question pour les services de santé, d'améliorer leurs conditions de fonctionnement par une bonne gestion des structures sanitaires et ainsi, parvenir à consolider la qualité de soin pour permettre les entrées et sorties au sein de n'importe quelle unité médicale. Ceci sera alors effectif, par le fait de bien conserver les informations médicales, pour savoir administrer un médicament à un quelconque patient et ne pas le faire fortuitement.

D'une manière plus générale, les Systèmes d'Informations Hospitaliers (SIH) s'occupent de la gestion de l'ensemble des informations, de leurs règles d'utilisation et de leur circulation. De plus, ils font face au stockage et au traitement des données pour répondre aux besoins quotidiens des établissements de soins ([11] et[19]).

Les performances et la qualité des services de soins reposent sur la qualité et la quantité des informations collectées dans les SIH. La DDS constitue un des indicateurs d'évaluation le plus utilisé et sa prédiction basée sur les données disponibles dans les SIH a été au centre d'un grand nombre de travaux de recherche. Le problème de la prédiction des durées

6

de séjours hospitaliers a été abordé sous différents angles dans des recherches précédentes. [19].

Le but de ce chapitre est de vouloir mettre à la lumière du soleil certaines informations sur le Système d'Information Hospitalier en partant de la sorte : tout d'abord nous allons décrire les systèmes d'Information Hospitalier d'une manière générale en parlant de la sources de ces informations ainsi que des propriétés y afferantes. En suite, nous allons parler de la durée de séjour hospitalier et les facteurs influençant cette dernière pour enfin chutter avec le rôle des machines learning dans tout ceci.

1.2 Les systèmes d'informations hospitaliers 1.2.1 Terminologie

Définition 1.1 Un Système d'Information Hospitalier (SIH) est un Système informatique destiné à faciliter la gestion de l'ensemble des informations médicales et administratives d'un hôpital. Selon [19], on appelle système d'information l'ensemble des outils matériels, des logiciels et des réseaux de télécommunications utilisés pour recueillir, créer et distribuer des données utiles dans des organisations.

En particulier, un Système d'Informations Hospitalier (SIH) désigne un système conçu pour gérer l'ensemble des données médicales et administratives d'un hôpital. Il se constitue d'un groupe d'éléments en communication qui rassemblent, traitent et fournissent les informations nécessaires à son activité.

Définition 1.2 Un Système d'information de l'hôpital est un ensemble des éléments en interaction ayant pour objectif de rassembler, traiter et fournir les informations nécessaires à son activité.

Définition 1.3 Un Système d'Information de Santé (SIS) est un Système d'information global, regroupant tous les types d'acteurs et ressources de santé.

1.2.2 Type d'informations

Dans un milieu hospitalier, plusieurs informations sont récueillies, tantôt lors de l'admission du patient et au fur et à mesure que le patient augmente son séjour à l'hopital. On a donc besoin souvent des informations antérieures du patient et quelques informations administratives. Selon [19], ces informations comprennent les données démographiques sur les patients, les étapes de son suivi, les complications, les médicaments, les signes vitaux, les antécédents médicaux, les immunisations, les données de laboratoire et les rapports de radiologie [HIM]. Les informations administratives concernent la gestion opérationnelle d'un hôpital en matière de soins de santé. Elles englobent les informations de la gestion des patients (parcours, facturation, actes médicaux), la gestion de la finance et de la comptabilité (budget, ressources matérielles, achats) et la gestion des ressources humaines (affectations, planning, payement).

Le SIH est scindé en trois sous-systèmes comme illustre la figure 1.1 ([11], [18] et[19] )

:

7

FIGURE 1.1 - Composantes des Systèmes d'Informations Hospitaliers [11]

8

Le sous-système de production des soins

Ce volet s'occupe de l'administration des données patients, les unités de soins, la communication entre ces unités et la gestion de la recherche et de l'enseignement médicaux. Il contient toutes les données liées au patient comme par exemple : le diagnostic médical, les prescriptions et la réalisation des actes médicaux, l'édition des comptes rendus et les résumés de dossier sont présentes au sein de ce sous-système.

Le sous-système d'information logistique

L'objectif est donc de mieux organiser les activités et les structurer afin d'assurer une meilleure qualité de soins des patients. Le sous-système d'information logistique permet de gérer les différents ressources matérielles, humaines, physiques et financières de l'hôpital. Il englobe la gestion de stocks et des approvisionnements, la gestion des locaux, la gestion des facturations et des commandes, la gestion des lits d'hospitalisation et de soins ainsi que les archives et la documentation des établissements de soins.

Le sous-système de pilotage

Il veille à la prise en charge de la gestion médicoéconomique de l'hôpital. Il concerne la qualité des soins et la gestion des risques. De plus, il s'intéresse à l'allocation budgétaire des différentes unités de soins .

Ces sous-systèmes sont souvent en interaction afin d'assurer la continuité des services de soins, améliorer leur qualité et gérer les ressources et les contraintes budgétaires. Compte tenu du grand volume des données des SIH, divers formats de stockage sont apparus. Ces données proviennent de multiples sources et font l'objet de plusieurs études dans le domaine médical. Quoi que ces données existent, elles proviennent de quelque part effectivement. Dans la partie suivante, nous allons parler des différentes sources des données hospitalières.

9

1.3 Sources des données des SIH

Les progrès technologiques et les progrès des processus de traitement des données ont permis une augmentation exponentielle de la quantité des données collectées dans le domaine de la santé. Le volume des données contenues dans les SIH ne cessent de croître. En fonction de leur type, les données sont recueillies à partir de différentes sources. Ces sources de données sont nombreuses et diffèrent selon le type de collecte, le format de représentation et la nature des informations. Les principales sources des données médicales sont : les dossiers médicaux, les enquêtes auprès des patients et les données administratives utilisées pour payer les factures ou gérer les soins ([20],[19]). Dans ce qui suit, nous détaillons les sources de données .

1.3.1 Dossier médical du patient

Il comporte les données démographiques du patient acquises au moment de son admission : sa date de naissance, son adresse, son statut marital et son sexe. Il contient également les données liées à son état de santé comme les résultats des analyses biologiques et les transcriptions médicales, les résultats d'examens radiologiques, le diagnostic médical, les antécédents médicaux et les rapports textuels cliniques.

1.3.2 Les données administratives

Elles peuvent inclure les données des facturations et des remboursements des séjours hospitaliers des patients. Les données de facturation sont souvent liées aux motifs d'hospitalisation représentés à l'aide de la Codification Internationale des Maladies (CIM) et aux procédures que le patient a subi au cours de son séjour. Les données administratives comportent aussi des informations sur le type de l'unité médicale, l'admission du patient, le nombre d'unités dans lesquelles le patient est passé (ou le nombre de jours passés dans chaque unité).

10

1.3.3 Les données issues des enquêtes et de la recherche clinique

Une source importante des données médicales est apparue avec l'explosion de l'utilisation d'internet comme moyen de communication. Les données de santé peuvent provenir des échanges des patients sur les réseaux sociaux et des recherches effectuées sur le web. Elles proviennent également des études cliniques réalisées par les professionnels de santé, les scientifiques et les industriels.

1.4 Propriétés des données médicales

"S'agissant des données de santé, informations éminemment sensibles, la tentation est exacerbée de se prévaloir d'un droit de propriété pour se garantir une meilleure protection contre tout usage préjudiciable" N. MALLET-POUJOL cité dans [9].

Vu que les données médicales doivent être protégées comme vu dans la section 1.3, il existe des données à caractère privé. Des lois pour palier à un quelconque dérapage des données médicales sont aussi de structe application.

Les données médicales sont à conserver jalousement non seulement du fait qu'elles sont sensibles, mais aussi car elles sont utilisées par des chercheurs, les hopitaux eux-mêmes, ... ces dernières nous aident même à l'organisation des établissements de soins, l'identification de profils homogènes de patients, le suivi des parcours des patients et la recherche de leur diagnostic médical. Cependant, avant d'utiliser ces données, il est primordial de procéder à leur annotation, de les intégrer et de les pré-renseigner de manière appropriée afin de faciliter leur compréhension. La compréhension et la manipulation des données médicales se heurtent à des défis liés à leur complexité, la richesse des informations aussi qu'à des contraintes de confidentialité [19]. Il existe donc des garentis juridiques pour n'importe quel dérapage de la part des données médicales [20].

La figure 1.2 nous illustre les différentes propriétés des données médicales ainsi que leurs sources. Particulièrement, les données que nous avons utilisées dans l'analyse de ce présent travail ne sont pas loin de respecter ces critères ici.

Les sous-sections suiventes nous servirons de détail pour les propriétés du SIH en paraphrasant [19].

11

FIGURE 1.2 - Données médicales : sources et propriétés [19]

1.4.1 Confidentialité

Selon l'article 4 du Règlement Général sur la Protection des Données (RGPD) de l'Union Européenne : « les données relatives à la santé physique ou mentale d'une personne physique, y compris la prestation de services de soins de santé, qui révèlent des informations sur l'état de santé de cette personne » sont définies comme données à caractère personnel. Ces donnes doivent donc être protégées et une politique et une démarche de sécurité de ces données doivent être définies pour les protéger. Si la protection des données est un enjeu majeur, d'autres risques liés au matériel et à l'infrastructure informatique sont également des points d'attention récurrents. Les données médicales sont exploitées dans plusieurs recherches et études académiques et industrielles. Elles peuvent être utilisées dans la conception des systèmes d'aide à la décision du domaine médical, l'amélioration des prestations de soins de santé, l'optimisation des ressources matérielles et humaines des hôpitaux. Un processus d'anonymisation ou de pseudo-anonymisation des données est donc utile avant toute manipulation. L'anonymisation des données médicales est définie comme la suppression de tout caractère identifiant un ensemble de données d'une

12

manière irréversible. Toutes les informations directement ou indirectement identifiables sont supprimées ou modifiées afin d'empêcher toute ré-identification des personnes. Quant à la pseudo-anonymisation, elle permet le retour à l'information originale en cas de besoin particulier. Elle consiste à remplacer les données à caractère personnel par des pseudonymes. Cette technique est réversible et permet donc la ré-identification ou l'étude de corrélations entre les informations codifiées en cas de besoin particulier. De cette manière, la réutilisation des données médicales est possible ce qui suscite un intérêt et une demande croissante.

1.4.2 Données incrémentales

A l'aire du Big data, les données médicales ne sont plus à ignorer. L'analyse des données massives est un domaine en pleine croissance qui peut fournir des informations utiles dans le domaine des soins de santé. Dans les systèmes d'aide à la décision ou de prédiction, les éléments collectés sont insérés dès leur disponibilité dans le modèle comme des évènements successifs. Un exemple qui caractérise cette particularité est de modéliser le séjour hospitalier par un processus de trois étapes : moment d'admission du patient, le séjour hospitalier et la sortie du patient.

Lors de l'admission du (de la) patient(e), des informations démographiques comme l'âge, l'adresse, le genre et l'état civil sont acquises ainsi que des informations administratives comme le type d'admission au service concerné, le motif d'hospitalisation et l'unité médicale dans laquelle le patient est admis.

Au cours du séjour hospitalier, d'autres informations médicales et administratives s'ajoutent. Par exemple les actes médicaux réalisés pour le patient, les complications médicales et les transferts entre unités médicales.

Et au finish, à la sortie du (de la) patient(e), les rapports médicaux effectués par les médecins ou les infirmiers sont élaborés. La régularisation de la facture, la durée de séjour du patient et son mode de sortie sont prélevés.

13

1.4.3 Hétérogénéité

De nos jours, il est nécessaire d'utiliser conjointement des données provenant de systèmes d'information qui utilisent différentes sources de connaissances comme par exemple, les rapports médicaux textuels et les résultats d'imagerie médicale pour l'enregistrement des données et les utiliser dans la résolution de nombreux problèmes dans le domaine médical. L'exploration de ces données dites hétérogènes pour extraire des connaissances est un processus fastidieux imposant des contraintes opérationnelles importantes. Les données hétérogènes sont des données dont les types et les formats présentent une grande variabilité. Il existe principalement 4 types d'hétérogénéité :

- L'hétérogénéité syntaxique : Elle se produit lorsque deux sources de données ne sont pas exprimées dans le même langage.

- L'hétérogénéité sémantique ou conceptuelle : Elle désigne les différences de modélisation d'un même domaine d'intérêt.

- L'hétérogénéité terminologique : Elle désigne les variations de noms lorsqu'on se réfère aux mêmes entités à partir de différentes sources de données.

- L'hétérogénéité pragmatique : Elle correspond à des interprétations différentes des entités.

De plus, nous rajoutons l'hétérogénéité par type de données. Elle réside dans ce cas dans la présence de données quantitatives ou dites numériques et qualitatives ou dites catégorielles. Les données quantitatives sont celles qui peuvent être comptées ou comparées sur une échelle numérique. On distingue alors les données quantitatives continues et discrètes. Pour le type qualitatif, on sépare le qualitatif nominal et le qualitatif ordinal. Par exemple l'âge d'un patient est une donnée numérique discrète, sa taille est une donnée numérique continue, son genre est une donnée catégorielle nominale et son niveau d'étude est une donnée catégorielle ordinale. Nous définissons aussi le type de donnée catégorielle multivaluée comme par exemple les diagnostics médicaux si le patient possède plusieurs diagnostics. Le format des données médicales peut être structuré ou non structuré. Le format des données structurées est organisé et formaté. Par conséquent, il est facile de saisir, rechercher et manipuler les données structurées. A l'inverse, les données non structurées comme par exemple les rapports médicaux en format textuel ou les images de

14

radiologie médicale, souvent classées comme des données qualitatives, sont plus difficiles à traiter et à analyser. Un processus d'intégration des données hétérogènes est crucial pour permettre aux utilisateurs de définir leurs requêtes sans connaître leurs sources et donner une vue uniforme de l'ensemble de ces sources.

1.4.4 Complexité

La grande quantité d'informations générées par les systèmes d'informations de santé, la variété des sources des données médicales et l'hétérogénéité des données rendent leur traitement et leur analyse plus difficile et plus complexe soulevant ainsi plusieurs défis. Parmi ces défis, nous retrouvons la présence de plusieurs variables ce qui engendre une grande dimension. De plus, ces données sont souvent incomplètes et contiennent des variables fortement corrélées entre elles résultant de la redondance de l'information. Les données médicales présentent également d'autres problèmes comme la présence des données aberrantes ou des erreurs dans les informations enregistrées. Ces problèmes imposent des méthodes de pré-traitement des données avant de les utiliser afin de rendre leur exploitation plus facile et fiable. La complexité des données médicales rend primordiale l'implication de l'expertise médicale dans leur exploitation par les utilisateurs afin de valider, interpréter et mieux valoriser leur contenu.

1.5 Durée De Séjour hospitalier

Définition 1.4 La Durée de Séjour Hospitalier peut être définie comme un séjour pendant lequel le patient peut être hospitalisé dans plusieurs services, que l'on appelle actuellement des " unités médicales "[4].

La figure 1.3 explique en quelques sortes la durée de séjour hospitalier dans un hopital en passant par une ou plusieurs unités médicales.

Face à un accroissement sans précédent du nombre de cas d'hospitalisation, l'apparution des nouvelles maladies et ou épidémies, la famine en RDC, les institutions sanitaires font face à un nombre accru des patients pouvant même dépasser la capacité d'accueil de ces derniers.

15

FIGURE 1.3 - Évaluation des systèmes de santé : DDS [19]

Pour faire face à tout ceci, la prédiction de la durée de séjour hospitalier est un facteur clé dans un service de santé, car contribue à la planification et à l'organisation des activités de soins, ainsi qu'au management des lits réduisant leur occupation inutile [19], mais aussi savoir gérer le personnel soignant et ouvrier pour l'assurance des malades. Chaque structure sanitaire est donc confrontée à faire face à un système de santé sans pareil pour permettre une bonne compétitivité au marché des hopitaux.

Selon [19], il existe trois facteurs importants pour définir la pertinance d'un système de santé, on peut citer : le taux de mortalité, le nombre de réadmissions et la durée de séjour hospitalier (DDS) .

Quant à l'unité de mesure de la DDS, elle est mesurée en journée. Cette définition peut changer constamment dans d'autres contextes. Dans les services d'urgence et ambulatoire, l'admission et la sortie du patient sont réalisées dans la même journée. De ce fait, la DDS est égale à 0 jour. La valeur de la DDS est alors calculée en nombre d'heures et peut s'étaler sur 24 heures au maximum. Plusieurs travaux ont étudié les flux des patients en service d'urgence en se basant sur l'estimation du nombre d'heures du séjour du patient dans ce service. Nous distinguons donc deux définitions majeures de la DDS : la DDS dans des unités médicales dites « programmées » calculée en nombre de jours passés dans ces unités et la DDS dans des services dits « non programmés » calculée en nombre d'heures. Dans ces deux cas, la DDS est quantifiée par une valeur numérique discrète.

Ce qui nous permet d'affirmer qu'une Durée de Séjour Hospitalier au délà de la moyenne provoquerait des coûts matériels que financiers suplémentaires à l'hopital. C'est ainsi alors

16

que la prédiction de DDS dans un service sanitaire est d'une importance capitale pour palier à ce problème.

1.6 Facteurs influençant la DDS

La durée de séjour hospitalieur est souvent dû à plusieurs facteurs qui sont tantôt d'origine du patient lui-même ( c'est à dire de son âge, de sa maladie, de son état psychique, ...) ou d'un autre facteurs exterieur. D'où alors la durée de séjour hospitalier dépend aussi de l'Unité médicale dans laquelle le patient est admis ([19]).

Parmi les facteurs influançant la DDS, on peut citer ([18]) :

1. Les facteurs démographiques : l'âge, le genre et la situation familiale du patient;

2. L'historique médicale du patient

3. Les mesures des signes vitaux et des résultats du laboratoire,

4. Etc.

Ce travail étant borné dans le service de Gynécologie, à part les facteurs vus ci-haut, les hopitaux aussi jouent un rôle dans la prédiction de la DDS. C'est comme le cas par exemple de la Gynécologie obstétrique où, pour un accouchement eutocique la DDS va de 2 à 5 jours selon les hopitaux consultés et pour un accouchement distocique, elle va de 4 à 9 jours.

1.7 Que vient faire l'intelligence artificielle dans tous ça ?

L'intelligence artificielle (Artificial intelligence en anglais) englobe plusieurs techniques comme par exemple l'apprentissage automatique (Machine Learning), la vision par ordinateur, le raisonnement, la représentation des connaissances et la fouille de données. Ces techniques font partie des techniques les plus utilisées de nos jours dans les différents domaines de recherche. Les applications de l'IA s'étendent à des domaines que l'on pensait auparavant réservés aux experts humains des données numérisées, d'infrastructure informatique, d'amélioration de la puissance et de la capacité de stockage des ordinateurs,

17

le domaine médical est identifié comme l'un des domaines les plus promoteurs de l'IA. L'apprentissage automatique ou le Machine Learning (ML) en anglais, est une technique de l'IA largement employée dans les recherches cliniques. Elle est apparue dans les années 1950 avec Alan Turing quand il a écrit un article sur « Computing machinery and intelligence » dans lequel il explique que pour démontrer l'intelligence d'une machine, elle doit être capable d'exécuter des tâches humaines de telle sorte que personne ne peut la différencier de celle d'un être humain.

La figure 1.4 illustre les principales techniques de l'Intelligence Artificielle et leurs applications [19].

FIGURE 1.4 - Techniques de l'Intelligence Artificielle et leurs applications [19]

L'apprentissage automatique consiste à doter les machines de capacités d'analyse, d'apprentissage et de généralisation à partir des données. L'objectif est de résoudre des problèmes pour lesquels il aurait été difficile de trouver une solution avec des approches informatiques traditionnelles. Il existe quatre types d'apprentissage automatique : l'apprentissage supervisé, l'apprentissage non-supervisé, l'apprentissage semi-supervisé et l'apprentissage par renforcement. En médecine, selon les nouvelles techniques de l'IA, plusieurs solutions sont en train de voir le jour comme c'est le cas par exemple de la prédiction du cancer, dans la prédiction d'une quelconque réadmission à l'hopital [13], ...

Comme nous pouvons le constanter, la Nouvelle Technologie de l'Information et de la Communication (NTIC) est au service de toute la communauté et ceci par l'apparution de l'Intelligence Artificielle où les machines prennent certaines décisions que prennaient

18

les humains dans l'ancien temps. Faudra-t-il que ceci soit possible sans nous interroger comment ça marche ? La mise en place d'un Algorithme de Machine Learning se fait le plus souvent par le canal de certains algorithmes (Modèles de prédiction). La partie suivante sera concencrée à certains modèles de machine learning qui nous servirons dans les deux derniers chapitres.

19

précédent sommaire suivant






La Quadrature du Net

Ligue des droits de l'homme