Le volume des données de santé numérisées, disponibles et interprétables est aujourd’hui colossal et continue de croître du fait d’une multitude de sources : comptes rendus de consultation, d’hospitalisation, d’imagerie, résultats de biologie… Cette masse d’informations constitue une source de progrès majeur pour la médecine car elle ouvre des perspectives dans l’amélioration des flux et l’organisation des soins. Elle constitue également une source de progrès pour la recherche, la personnalisation des traitements ou encore l’optimisation du système de santé. Pour un hôpital, une agence ou encore un regroupement de structures de santé, il peut s’avérer utile de réunir l’ensemble de ces informations dans un lieu unique afin d’en faciliter le traitement.
Un cadre très strict
Un entrepôt de données de santé (EDS) est alors la meilleure option. Il s’agit d’une structure centralisée réunissant au sein d’une grande base les données médicales, administratives et sociales des patients lors de leur prise en charge dans les établissements de santé. Les EDS sont constitués par des acteurs publics ou privés sur des durées longues, au moins dix ans, afin d’obtenir un volume de données important. Ils diffèrent en cela des projets de recherche ponctuels et constitués dans un but précis. Quel que soit l’objectif pour lequel est constitué un EDS, il doit être conforme aux exigences de la loi Informatique et libertés et au règlement européen sur la protection des données (RGPD).
Une fois mises en place, ces immenses bases de données sont alimentées par l’ensemble des professionnels intervenant dans la prise en charge des patients : médecins, pharmaciens, patients… La collecte est menée en s’assurant du consentement du patient afin de pouvoir ensuite réutiliser ces données, souvent partiellement, pour couvrir différents objectifs. Il peut s’agir de données collectées à des fins de pilotage, c’est-à-dire réutilisées pour la gestion et l’administration de l’activité. Elles peuvent aussi être réutilisées dans des cadres de recherche, d’études ou encore d’évaluation dans le domaine de la santé.
L’EDS doit être conforme aux exigences de la loi Informatique et libertés et au règlement européen sur la protection des données
En raison du caractère sensible de ces données de santé, leurs utilisations doivent être réalisées dans un cadre légal strict, qui impose de répondre à un certain nombre d’exigences réglementaires. Il s’agit avant tout de respecter les règles propres à la protection des données telles que la définition des acteurs, le principe de finalité ou encore la durée de conservation. Lors de la constitution de l’entrepôt, le responsable du traitement doit ainsi mettre en place une gouvernance de l’EDS afin de s’assurer du respect de ces principes et de garantir son fonctionnement à travers un comité de pilotage et un comité d’éthique. Les patients doivent également être informés de l’utilisation de leurs données soumises à protection particulière. Des mesures doivent être prises pour assurer par exemple le cloisonnement des données identifiantes, la pseudonymisation, la gestion des habilitations et des accès aux données.
Une enveloppe de 75 millions d’euros
Lancé en 2022, l’appel à projets « Accompagnement et soutien à la constitution d’entrepôts de données de santé hospitaliers » de France 2030 prévoyait une enveloppe de 50 millions d’euros pour constituer et consolider des EDS sur l’ensemble du territoire. En mars 2023, 25 millions d’euros supplémentaires ont été ajoutés. L’estimation du comité stratégique des données de santé préconise une enveloppe de 60 à 90 millions d’euros pour développer et maintenir annuellement un réseau de 30 EDS de taille critique, soit un par CHU.
En 2025, on dénombre 125 entrepôts de données de santé en France mis en œuvre par 102 acteurs différents : 45 acteurs publics, 32 acteurs privés à but non lucratif et 25 acteurs privés.
Du CHU de Nantes à l’Institut Curie
L’un des premiers EDS hospitaliers mis en place en France est celui du CHU de Nantes, fonctionnel depuis 2018. Il a permis la réalisation de plusieurs projets centrés autour de l’utilisation des données, dont le projet Argos. À l’origine, ce programme permettait un suivi épidémiologique du Covid sur le territoire couvert par le CHU. Il a ensuite été intégré au projet Synopse, soutenu par l’État, pour définir de nouveaux outils de suivi et être mieux préparé à la prochaine crise sanitaire.
Celui de l’Institut Curie, à Paris, a obtenu l’autorisation de la Commission nationale de l’informatique et des libertés (Cnil) depuis 2024. Il regroupe différents types de données : données cliniques, comptes rendus médicaux, imagerie médicale, lames numérisées d’anatomopathologie, données omiques (données caractérisantes et quantifiant un ensemble biologique pour comprendre comment les éléments interagissent entre eux). La création de cet outil s’inscrit dans la volonté de l’Institut de développer de nouvelles stratégies thérapeutiques en cancérologie.
L’entrepôt des données de santé mis en place par les Hospices civils de Lyon fournit un autre exemple concret. Il reprend les données médicales et administratives des patients venant dans l’établissement pour consultation ou hospitalisation. En plus de faire avancer la recherche médicale en menant des études à grande échelle, cet EDS vise à améliorer l’organisation des soins et la prise en charge des patients.
Dépistages organisés des cancers : les plus modestes y recourent moins souvent
Handicap : un plan d’action pour améliorer la reconnaissance de l’intimité et le repérage des violences
Réorganisation de Santé publique France : un « choix d'efficacité » selon la ministre Rist
Cadmium, mercure ou acrylamide dans l'alimentation : les Français exposés à des niveaux « toujours préoccupants » , selon l'Anses