Ce cours porte sur les principes de conception et les fondements algorithmiques des systèmes logiciels influants pour les mégadonnées analytiques. Le cours commence par la conception de grands entrepôts de données d'entreprises, les techniques de traitement des requêtes pour le traitement analytique en ligne et le data mining dans l'entrepôt de données. Le cours étudie ensuite les changements architecturaux fondamentaux vers cluster de serveurs partagé, notamment les bases de données parallèles, MapReduce, columnstore et la prise en charge de traitement par lots, d'algorithmes itératifs, de l'apprentissage machine et des analyses intéractives dans ce nouveau contexte.

 

Evaluation : série devoirs écrits et de programmation + examen final

Langue : Anglais




Systems for Big Data

This course covers the design principles and algorithmic foundation of influential software systems for Big Data Analytics. The course begins with the design of large enterprise data warehouses, query processing techniques for Online-Analytic Processing, and data mining over data warehouses. The course then examines fundamental architectural changes to scale data processing and analysis to a shared-nothing compute cluster, including parallel databases, MapReduce, column stores, and the support of batch processing, iterative algorithms, machine learning, and interactive analytics in this new context.

 

The prerequisite for this course is INF553. The coursework includes a series of written and programming assignments and a final exam.

The course will be taught in English.