Cet enseignement a trois objectifs. Le premier objectif est d'introduire les outils de statistique mathématique et d'apprentissage statistique ("machine learning"). Nous décrirons toutes  depuis le choix d'un modèle statistique, l'estimation des paramètres et l'inférence et le choix de modèles. Nous apprendrons à construire des estimateurs, des tests, des règles de classification, à évaluer les performances de ces règles. Nous introduirons un certain nombre d'outils théoriques - théorie de la décision, processus empirique-. Les deux derniers cours seront consacrés à une introduction à l'apprentissage statistique. Le deuxième objectif est de décrire, dans le cours et dans les petites classes, des exemples concrets de modélisation dans divers domaines (traitement du signal et des images, économétrie, sciences de l'environnement, classification de formes etc.). Le troisième objectif est de développer un savoir-faire pratique fondé  permettant de comprendre la façon dont  les outils théoriques peuvent être mis en oeuvre dans des applications concrètes (utilisation de R ou de Python).

Contenu du site. Vous trouverez sur ce site toutes les ressources pédagogiques mises à disposition pour ce cours.

Les diapositives des leçons, les énoncés des exercices  traités en PC et leurs corrigés sont mis à jour régulièrement.

Les énoncés des devoirs maison (DM) et des explorations numériques brèves hebdomadaires, ainsi que leurs corrigés, seront aussi déposés sur ce site.

 

Intervenants dans les cours d'Amphi et en PC.

  • M. Eric Moulines, Professeur à l'Ecole Polytechnique, 
  • M. Sébastien Gadat, Professeur à Toulouse School of Economics, spécialiste  d'apprentissage statistique.
  • Mme Gersende Fort, Directrice de Recherche CNRS à l'Institut de Mathématiques de Toulouse, spécialiste de statistique numérique et probabilités appliquées
  • M. Aymeric Dieuleveut, Professeur assistant à l'Ecole Polytechnique, spécialiste d'apprentissage statistique et optimisation stochastique.
 
Intervenants dans les PC.  En plus de ces quatre enseignant-chercheurs, l'équipe pédagogique comporte

  • Mr Matthieu Lerasle, Professeur à l'ENSAE, spécialiste de statistique non paramétrique et de statistique des données dépendantes.
  • Mme Marylou Gabrié, Professeure assistante à l'Ecole Polytechnique, théorie de l'apprentissage statistique, physique statistique, simulation.
  • Mr. Edouard Oyallon, Chargé de Recherche au CNRS, théorie de l'apprentissage profond, apprentissage statistique
  • Mr Victor-Emmanuel Brunel, Professeur à l'ENSAE, optimisation convexe, estimation non-paramétrique.
 
Intervenants dans les travaux . L'équipe pédagogique est composée de ces cinq chercheurs et enseignant-chercheurs et de
  • Un doctorant, en charge des expérimentations numériques
  • Un doctorant qui nous assistera pour les corrections de copies de DM.
Recherches maison notées. Afin de répondre à la demande des promotions passées, deux formes types d'activité sont proposées :
  • deux devoirs maison contenant une partie "problème" et une partie numérique à résoudre en Python.  
  • quatre explorations numériques brèves, à réaliser en Python, afin de visualiser les notions vues en cours sur des exemples jouets.
 

Validation du cours. La note littérale est calculée de la façon suivante:

  • 3/4 Note du contrôle écrit
  • 1/4 Contrôle continu (DM, Exercices numériques)
  • Bonus / Malus [rendu des Recherches maison notées, participation en PC]: -3/+3