- Formation mise en place en collaboration avec l'ATIH
- Nombre de participants restreint pour favoriser les échanges et permettre une mise en pratique optimale
- Les aspects techniques et informatiques seront abordés de façon progressive au cours de la formation
- Conseils sur les bonnes pratiques et les pièges à éviter
- Sensibilisation aux enjeux réglementaires (RGPD, AI Act)
Objectifs
- Être capable d’identifier une problématique prédictive adaptée aux données PMSI et de formaliser une variable cible exploitable.
- Mettre en œuvre un pipeline avec scikit-learn : préparation, entraînement, évaluation
- Mettre en œuvre et comparer au moins trois modèles (régression logistique, Random Forest, Gradient Boosting) et interpréter leurs performances.
- Appliquer la démarche à un cas d’usage des données du PMSI MCO (bases de travail ATIH)
Public visé
Toute personne souhaitant s’initier au machine learning appliqué à des données PMSI avec Python :
- médecin DIM
- médecin de santé publique
- statisticien·ne / biostatisticien·ne
- data manager / gestionnaire de données
- ingénieur·e (établissement de santé, ARS, CIC, bureau d’études)
- équipes de recherche
Prérequis
Avoir suivi le module 2 « Python pour l’analyse des données PMSI » du cycle « Python appliqué aux données PMSI » ou utiliser régulièrement le langage Python (manipulation de données avec pandas, connaitre NumPy, savoir utiliser Matplotlib).
Les personnes débutantes (ou n’ayant pas pratiqué récemment) sont invitées à suivre au préalable le module d’initiation « Introduction à Python avec des données PMSI »
Perspectives
Renforcement des compétences en analyse et valorisation des bases PMSI via Python en vue d’évoluer vers des fonctions nécessitant des capacités d’exploitation des données PMSI ou données de santé en générale