IA ET RECHERCHE

Des modèles de langage vraiment efficaces pour prédire les flux de patients

Par
Publié le 16/04/2026

Les grands modèles de langage pourraient exploiter les parcours de soins pour mettre en place une approche prédictive des flux de patients. Une étude publiée par la DREES décrit un outil d’une réelle efficacité dans le champ de certaines pathologies ciblées. Même si des progrès restent à faire pour prendre en compte les disparités socio-économiques.

Big data

Nos organisations sont, pour la plupart, assujetties aux variations de flux de patients qui accompagnent les maladies chroniques, les habitudes de vie des patients ou les épidémies. Il serait tellement plus confortable de pouvoir prévoir à moyen terme le nombre de personnes à prendre en charge dans chaque service.

Les grands modèles de langage pour exploiter les parcours de soins

Ce sera peut-être possible dans un futur proche. La Direction de la recherche, des études, de l’évaluation et des statistiques (DREES) vient en effet de publier un dossier sur l’apport des modèles de prédiction du parcours de soins appliqués aux données issues du système national des données de santé (SNDS). Cette base de données médico-administratives contient une multitude de types de données de santé aussi variées que les délivrances de médicaments, les diagnostics posés à l’hôpital ou les actes médicaux et paramédicaux de ville. Et même si elle dépend des statistiques relevant du recours au système de santé, à la facturation des actes, ainsi que de la qualité du codage, et si les informations qu’elle contient ne couvrent pas l’ensemble des déterminants de santé et ne renseignent qu’indirectement l’exposition à des facteurs de risque majeurs, la SNDS permet développement de méthodes d’intelligence artificielle.

Une approche prédictive à partir des données du SNDS

Les chercheurs de la DREES ont, pour étayer leur travail statistique, fait usage des grands modèles de langage pour consolider l’approche prédictive qui consiste à exploiter l’enchaînement des événements de santé pour chaque patient et à transformer les parcours de soins en séquences d’événements (près de 80 000 événements différents), comparables à des mots dans une phrase. Grâce à sa taille (28 milliards d’événements utilisés), son exhaustivité et son caractère longitudinal, le SNDS semble une base de données particulièrement adaptée à une étude à très grande échelle de ce type. Ils ont ainsi comparé ces nouveaux modèles à des approches plus classiques qui reposent sur les indices de comorbidité, la cartographie des pathologies ou la fréquence de recours aux soins par exemple, exploitées par des modélisations statistiques plus traditionnelles.

Une réelle efficacité dans le champ de certaines pathologies ciblées

L’approche basée sur les modèles de langage n’a pas généré d’avancée majeure en termes de performances pour les maladies chroniques fréquentes, les modèles classiques étant déjà très pertinents. Elle est toutefois très efficace pour l’étude des événements plus complexes, rares ou difficiles à anticiper, l’analyse des trajectoires complètes apportant un bénéfice important. Dans leur article, les chercheurs de la DREES évoquent des pathologies comme l’épilepsie, où les hospitalisations pourraient être anticipées à partir de la séquence de traitements antiépileptiques et de soins précédant la décompensation, l’endométriose ou la maladie de Parkinson, pour laquelle les trajectoires pourraient permettre la prédiction de la perte d’autonomie. Le modèle n’est d’autre part pas pertinent pour des pathologies aiguës difficiles à prédire comme l’appendicite.

Des progrès à faire pour prendre en compte les disparités socio-économiques

Un autre point est sans doute à améliorer, sur le champ des disparités socio-démographiques et socio-économiques. Il apparaît en effet que les prédictions des différents modèles sont meilleures pour les femmes, pour les personnes âgées de 40 à 70 ans et pour les niveaux de vie élevés. La prise en compte, plus en profondeur, des biais socio-économiques et territoriaux de ces modèles prédictifs entraînés à grande échelle est primordiale. Mais les résultats montrent tout de même que les modèles de langage fondés sur les trajectoires de soins améliorent sensiblement la prédiction du risque d’hospitalisation pour plus de 180 pathologies. Les chercheurs donnent l’exemple du modèle le plus avancé, de type transformer (BEHRT-SNDS), qui offre les meilleures performances.

De grands espoirs sur l’évolutivité du modèle

Dans ce contexte, les signaux d’état de santé disponibles dans la base principale du SNDS ont un pouvoir prédictif significatif sur la suite du parcours de soins et pourraient rendre des services dans une perspective de santé publique à l’échelle populationnelle. Les chercheurs remarquent même que les informations contenues dans le SNDS paraissent sous-exploitées au regard des méthodes d’intelligence artificielle les plus modernes. Le modèle BEHRT-SNDS, le meilleur modèle que les chercheurs de la DREES ont appris dans leurs travaux, n’a pas fait l’objet d’une optimisation particulière. Ils ont privilégié une architecture éprouvée et reproductible, représentative de la famille des modèles "Transformer" et, à la lumière de cette première estimation de la valeur prédictive de l’usage des données collectées à grande échelle, sur les parcours, ils fondent de grands espoirs sur l’évolutivité du modèle, étant donné les progrès techniques récents et à venir, et l’intégration de nouvelles données dans le SNDS.

Mieux cibler les populations à risques dans les politiques de santé

Ils remarquent enfin que, lorsque les biais socio-économiques et territoriaux de ces modèles seront mieux pris en compte, ils disposeront d’un formidable outil pour mieux cibler des populations à risque dans les politiques de santé en fonction, notamment, du niveau de vie, de nature à accroître les inégalités de santé, en ciblant mieux les plus aisés et les personnes les plus proches du système de santé ainsi que, à l’autre bout de la chaîne les plus à risque, et en capturant indirectement les comportements de recours aux soins et le surrisque qui peut résulter d’un éloignement du système de santé.

Lire l'article de la DREES ICI.


Source : infirmiers.com