Ce cours porte sur les principes de conception et les fondements algorithmiques des systèmes logiciels influants pour les mégadonnées analytiques. Le cours commence par la conception de grands entrepôts de données d'entreprises, les techniques de traitement des requêtes pour le traitement analytique en ligne et le data mining dans l'entrepôt de données. Le cours étudie ensuite les changements architecturaux fondamentaux vers cluster de serveurs partagé, notamment les bases de données parallèles, MapReduce, columnstore et la prise en charge de traitement par lots, d'algorithmes itératifs, de l'apprentissage machine et des analyses intéractives dans ce nouveau contexte.

 

Evaluation : série devoirs écrits et de programmation + examen final

Langue : Anglais