Quelles données ouvrir ?

Quelles données ouvrir ?

Le SNDS regroupe plusieurs bases de données, fournissant des données différentes. Comme nous l’avons dit précédemment, le SNIIRAM, base de données de l’Assurance Maladie en fait partie.

Les données de l’Assurance Maladie (SNIIRAM)

Les données sont récoltées depuis 2002, et organisées en différents sous-ensembles distincts, qui sont accessibles en ligne indépendamment :

L’entrepôt SNIIRAM, contenant toutes les données de remboursement issues des différents régimes d’assurance maladie obligatoire, sert à construire les autres sous-ensembles. Les données de cet entrepôt ne sont pas accessibles directement. Les données y sont conservées pour une durée maximale de 3 ans.

Les datamarts : ce sont des ensembles de données ciblées, organisées, regroupées et agrégées pour répondre à un besoin ou à un métier spécifique. Ces datamarts sont au nombre de 15, et se focalisent sur autant de thèmes dont le suivi des dépenses (Damir), l’analyse de l’offre de soins libérale, la biologie, la pharmacie, les dispositifs médicaux, les établissements privés etc… Il n’y a pas de durée limite de conservation.

Les Données de Consommation Inter-Régimes (DCIR) : base de données exhaustives individuelles anonymisées qui rassemble les données de remboursements de soins, de 93% de la population française. Cette base de données est utilisée pour réaliser des études sur la consommation des soins. Elle est individuelle dans le sens où les données du DCIR sont détaillées par bénéficiaire (identifiants anonymes) et par offreur de soins (prescripteur et exécutant, identifiant en clair pour l’assurance maladie obligatoire). A ce jour, le DCIR ne prend en compte que les personnes appartenant au régime général de l’Assurance Maladie (80% de la population), au MSA et au RSI, mais il a vocation à s’étendre aux autres régimes obligatoires dans les années à venir. Ces données sont accessibles sur une durée de 3 ans.

Echantillon Généralisé des Bénéficiaires (EGB) : c’est un échantillon vivant permanent représentatif de la population protégée par l’Assurance maladie française. Il contient des informations anonymes sur les caractéristiques sociodémographiques et médicales des bénéficiaires et les prestations qu’ils ont perçues. Aujourd’hui, près de 660 000 personnes en font partie. Il contient les mêmes informations que le DCIR, mais ce n’est qu’un échantillon.
Cet échantillon permet de réaliser des études longitudinales et de reconstituer le parcours de soins des patients sur 20 ans, que ce soit en ville ou à l’hôpital. Il permet également d’estimer la population protégée par la sécurité sociale ainsi que le taux de recours aux soins des patients et les caractéristiques des dépenses individuelles de santé.

Les données du Programme de Médicalisation des Systèmes d’Information (PMSI) : ces données détaillées, exhaustives et anonymisées sont accessibles aux utilisateurs ayant accès à la base DCIR. L’identifiant anonyme (NIR anonymisé) des patients est commun à la base DCIR et au PMSI, ce qui autorise le chaînage par les utilisateurs au cas par cas des données issues de ces deux bases. Le chaînage des données issues de l’EGB et du PMSI pourra être réalisé et les utilisateurs accéderont donc à des données déjà chaînées.

Les données sont ensuite archivées pendant 10 ans, et accessibles uniquement avec l’approbation de la CNIL (Commission National de l’Informatique et des Libertés).

Les données des hôpitaux (Programme de Médicalisation des Systèmes d’Information, PMSI)

Le PMSI est le système d’information utilisé par les établissements de santé publics et privés pour centraliser leurs données. Les informations sont transmises sous une forme bien particulière : le Résumé de Sortie Standarisé (RSS), réalisé aussitôt que le patient est sorti. Ce RSS contient le « diagnostic principal » c’est-à-dire le problème de santé pour lequel le patient a été admis dans l’établissement. Les diagnostics sont codés d’après la CIM-10 (Classification internationale des maladies et recours aux services de santé no 10) mise en place par l’OMS, qui compte près de 155 000 codes différents. Le RSS peut aussi contenir les informations sur les actes médicaux réalisés, codés d’après la CCAM (Classification commune des actes médicaux) ainsi que des informations sur le patient telles que sa date de naissance, sexe, code postal, date d’entrée dans l’unité médicale, date de sortie… Les RSS sont anonymisés et deviennent alors des « RSA » (résumés de sortie anonymes) grâce à un algorithme qui a été validé en 2001 par la CNIL.

Les établissements de santé produisent également des données agrégées à travers le PMSI, qui sont appelées Groupes Homogènes de Malades (GHM). Cette classification est d’ordre médico-économique, c’est-à-dire qu’elle réunit les RSA en prenant en compte des données médicales et économiques pour l’homogénéité des groupes. Ces groupes sont mis à jour régulièrement avec un logiciel appelé « groupeur ». Il existe plus de 600 GHM au total et chacun d’entre eux est subdivisé en 4 niveaux de sévérité différents.
Le PMSI montre un double intérêt : pour l’Etat, il permet de contrôler et comparer les activités entre établissements, et pour les Agences Régionales de Santé, cela est un outil inestimable pour les études épidémiologiques.

Les données du CépiDC de l’Inserm (Centre d’épidémiologie sur les causes médicales de décès)

Les missions essentielles du CépiDc sont la production annuelle de la statistique des causes médicales de décès en France (540 000 décès par an), la diffusion des données et les études et recherches sur les causes médicales de décès. Ces données sont établies à partir de deux documents : le certificat médical et le bulletin d’Etat civil de décès. Le CépiDc, après avoir analysé les diagnostics inscrits sur les certificats médicaux de décès, les transcrivent selon les règles de la Classification Internationale des Maladies (CIM10). Les codeurs médicaux de CépiDc veillent à mettre en place de nouvelles méthodes de transcription afin de garantir la qualité de ces données.

A ces bases de données s’ajoutent également :

  •  Les données relatives au handicap en provenance des MDPH (Maisons Départementales des Personnes Handicapées) – données de la CNSA.
  •  Un échantillon de données en provenance des organismes d’Assurance Maladie complémentaire.

 

Sources :
ameli.fr – Sniiram
ameli.fr – Pratiques et Organisation des Soins 2009 n°3
soldarites-sante.gouv.fr – Le SNIIRAM et les bases de données de l’Assurance Maladie en 2011
Rapport du Haut Conseil de la Santé Publique. Pour une meilleure utilisation des bases de données nationales pour la santé publique et la recherche (mars 2012).

Retour vers

Risque d’étatisation : ouverture ou fermeture ?

Continuer vers

Anonymisation ou pseudonymisation des données de santé

Schéma général

Schéma général