MENU
Diplôme d'établissement (DE)
< RETOUR

Science des données PMSI

  • Une formation en collaboration avec l’ATIH
  • Une montée en compétences progressive et structurée : du requêtage de base à l’analyse prédictive sur les données PMSI (MCO, SMR, HAD)
  • Une maîtrise approfondie de R et SQL sur la plateforme de l'ATIH
  • Une double expertise reconnue en data science et en exploitation des bases médico-administratives
  • Une maîtrise de trois langages leader de la data science (R, SQL et Python)
  • Une flexibilité du parcours possible sur 1 ou 2 années, en cycle complet ou modulaire 

Objectifs

  • Maîtriser l’architecture et les spécificités des bases PMSI de l’ATIH (MCO, SMR, HAD)
     
  • Développer ses compétences en requêtage SQL et en programmation avec R et Python
     
  • Connaître les fonctionnalités des environnements de développement intégré Anaconda et RStudio
     
  • Elaborer une démarche d’étude utilisant les données PMSI, partant du plan d’extraction au plan d’analyse
     
  • Implémenter des algorithmes classiques de data science et machine learning en utilisant les bases PMSI
     
  • Analyser et restituer des résultats dans une perspective stratégique ou décisionnelle (hospitalière, territoriale)

Public visé

Toute personne souhaitant développer ou renforcer ses capacités à exploiter les bases PMSI à des fins d’analyse, de pilotage ou de recherche, notamment :  

  • Médecin DIM, médecin de santé publique, praticiens hospitaliers
  • Techniciens de l’information médicale (TIM), statisticien, data-manager, ingénieur hospitalier
  • Personnel ARS, Assurance Maladie, chercheurs travaillant sur les données médico-administratives

Prérequis

Connaissance du PMSI MCO

Perspectives

Renforcement des compétences en analyse et valorisation des bases PMSI via R, SQL via R et Python en vue d’évoluer vers des fonctions nécessitant des capacités d’exploitation des données PMSI ou données de santé en générale 

Débouchés possibles :

  • Data analyst hospitalier (DIM, ARS, …)
  • Chargé d’études en santé publique, data manager en santé
  • Consultant en exploitation de données de santé
  • Chercheur exploitant les bases médico-administratives 

Compétences visées

  • Exploiter efficacement les bases de données PMSI (MCO, SMR, HAD) dans une démarche analytique structurée
     
  • Maîtriser les langages R, SQL et Python pour le requêtage, la manipulation et l’analyse de données hospitalières
     
  • Construire et automatiser des requêtes SQL complexes dans R en environnement réel (plateforme ATIH)
     
  • Élaborer des indicateurs d’activité ou de parcours et produire des analyses statistiques descriptives ou inférentielles
     
  • Implémenter des modèles prédictifs sur les données PMSI à l’aide de méthodes de machine learning (classification, arbres, …)
     
  • Structurer un projet d’analyse PMSI du plan d’extraction au plan de restitution, avec traçabilité et reproductibilité (R Markdown, quarto document, notebooks)
     
  • Mettre en œuvre des projets de data science hospitalière intégrant des données PMSI 
     

Contenu de formation

Ce diplôme d’établissement « Sciences de données PMSI » est structuré autour de deux cycles, chacun composé de trois modules progressifs. Il permet une montée en compétences croisée sur :

  • l’architecture des tables PMSI,  
  • le requêtage SQL via R  
  • la programmation en R et Python,
  • l’application de méthodes de machine learning sur les données PMSI  

 

Cycle 1 : Traitement des données PMSI avec R et SQL
Session 1 : du 16/03/2026 au 26/06/2026 / Session 2 : du 07/09/2026 au 24/11/2026

  • Module 1 : Plateforme des données hospitalières et techniques de base de requêtage via RStudio (niveau initiation-PMSI MCO)  
  • Module 2 : Requêtage et analyse inter-champs PMSI sur la plateforme ATIH via R (niveau intermédiaire- MCO, SMR et HAD)  
  • Module 3 : Exploitation avancée des données PMSI par la data science avec R (niveau avancé, machine learning)

 

Cycle 2 : Python pour l’analyse des données de santé et la data science
Du 12/10/2026 au 24/11/2026

  • Module 1 : Introduction à Python avec des données PMSI (niveau initiation-PMSI MCO)
  • Module 2 : Python pour l’analyse des données PMSI (niveau intermédiaire- PMSI MCO)
  • Module 3 : machine learning appliqué aux données PMSI avec Python (niveau avancé, machine learning)

 

(page actualisée le 04/06/2025)

 

Parcours

MODALITÉS PÉDAGOGIQUES :

La formation se réalise en présentiel, et se déroule dans une salle informatique, PC et accès aux logiciels fournis

 

METHODES PEDAGOGIQUES

  • Accès aux ressources pédagogiques sur la plateforme "Campus"
  • Exposé magistral, démonstration
  • Etudes de cas
  • Exercices d'application

 

Travail personnel : environ 150 heures

 

MODALITES TECHNIQUES ET ASSISTANCE TECHNIQUE ET PEDAGOGIQUE

Lien vers la page de présentation

 

 

PARCOURS PÉDAGOGIQUE :

Le diplôme peut être réalisé en 1 ou 2 ans. Il doit inclure la réalisation des deux cycles. Le cycle Traitement des données PMSI est dupliqué en deux sessions pour 2026. 

ÉVALUATION / VALIDATION :
  • Recueil des attentes
  • Auto-positionnement
  • Recueil des appréciations
  • QCM à la fin de chaque module
  • Contrôle d'assiduité
  • L'obtention du diplôme sur la réalisation et la validation de projets individuels d'analyse de données qui seront réalisés en cours du dernier module de chaque cycle

 

L’évaluation des acquis est réalisée à la fin de chaque cycle, et comprend :

  • un QCM de validation des connaissances en fin de chaque module
  • et un projet individuel de traitement de données PMSI mobilisant les compétences acquises, de l’extraction à l’analyse prédictive. 

Modalités de candidature

Un CV est à joindre à votre demande d’inscription.

Nombre maximum de participants : 12

Responsable(s) pédagogique(s)

default_picto
Responsable pédagogique
Dr Juste GOUNGOUNGA
Professeur, Département Méthodes quantitatives en santé publique, EHESP

Intervenants

Nolwenn LE MEUR
Professeur, Département Méthodes quantitatives en santé publique, EHESP 

 

Jérôme BROCCA
Référent National SNDS Données de Santé

 

Céline LEROY
Référente nationale SNDS Données de Santé

 

Myriam MAUMY
PU mathématiques appliquées, EHESP

Contacts

  • Information pédagogique :

metis@ehesp.fr

 

  • Candidature :

candidaturefc@ehesp.fr

 

Formation accessible aux personnes en situation de handicap avec possibilité d’aménagement de la formation

 

  • Référente handicap, Sandrine Villalon : 

referent-handicap@ehesp.fr 

Accessibilité | Ecole des hautes études en santé publique (EHESP)

Partenaires

logo ATIH
ATIH

Chiffres clés

Nombre de professionnels formés au parcours complet : 7 (2025) - 5 (2024)

Taux de réussite aux examens : 100% (2024)

Taux d'abandon : 0% (2024)

Autres formations conseillées

Diplôme d'établissement (DE)

SCIENCE DES DONNEES EN SANTE PUBLIQUE

35 jours / 245 heures

Rennes

Voir la fiche formation

NOUVEAUTÉ
Diplôme d'établissement (DE)

Praticien DIM MCO

12 jours (3 modules de 4 jours)

Hybride : à Rennes + à distance

Voir la fiche formation

Diplôme d'établissement (DE)

Expert PMSI

27 à 31 jours (7 à 8 modules de 2,5 à 5 jours)

Rennes

Voir la fiche formation

Inscrivez-vous à notre liste de diffusion pour recevoir les dates de la prochaine session et restez informé des actualités de la formation : nouveautés, webinaires, événements, ressources en ligne…

Chaque mois, l’EHESP vous propose une sélection inspirante :

Actualités, nouvelles formations, événements à venir, webinaires, témoignages de terrain, ressources en ligne, publications récentes…

S'inscrire

Faites-nous part de vos centres d'intérêt !