Gestion des données manquantes

Malgré la quantité croissante de données disponibles et l’émergence du Big Data, les problématiques de données manquantes restent très répandues dans les problèmes statistiques et nécessitent une approche particulière. Ignorer les données manquantes peut entraîner, outre une perte de précision, de forts biais dans les modèles d’analyse.

Voici un programme détaillé, adaptable à tous niveaux, pour savoir gérer les données manquantes :
Prérequis : Utilisation du Machine learning, Initiation au logiciel R

  1. Introduction - les concepts
  2. Typologie des données manquantes
  3. Analyse sans complétion
  4. Méthodes d'imputation