MENU
SESSION COURTE
< RETOUR

Utilisation de la DataScience pour exploiter les données PMSI

Objectifs professionnels

  • Acquérir les compétences sur le thématique spécifique: la data science et le machine learning via R
  • Connaître la librairie « tidymodels » et les implémentations des algorithmes classiques de machine learning
  • Être capable d’appliquer et de paramétrer ces méthodes sur les données de santé

 

Public visé

Toute personne désirant connaître et exploiter les différentes bases de données PMSI, SAS, Enterprise Guide, SQL, R : médecin DIM, médecin de santé publique, MISP, IASS, statisticien, data-manager, ingénieur hospitalier, personnel ARS, Assurance Mlaadie, bureau d'étude

Contenu de formation

Machine Learning : méthodologie générale

L’apprentissage supervisé via workflow tidymodel R

  • Construction du jeu de données et préparation des données
  • Comparaison des modèles supervisés de classification ou de régression (Régressions, Gradient Boosting, Random Forest, svm, etc.)
  • Paramétrage et entraînement du modèle
  • Évaluation du modèle
  • Diagnostique, gestion du sur-apprentissage ou du sous-apprentissage, Cross-Validation

Introduction à l’apprentissage non-supervisé

Cas d’utilisation sur les données médico-administratives (PMSI, ScanSanté…)

PARCOURS PÉDAGOGIQUE :

Module 5 du Cycle Traitement des données PMSI

Intervenants

default_picto
Responsable pédagogique
Dr Sahar BAYAT
Professeur, Département Méthodes quantitatives en santé publique, EHESP
default_picto
Responsable pédagogique
Fei GAO
Professeur, Département Méthodes quantitatives en santé publique, EHESP