Dans ce cours, nous introduisons la technologie bioinformatique fondamentale pour l'analyse des données de séquençage. Nous nous concentrerons sur la compréhension des méthodes informatiques fondamentales qui permettent le traitement direct et d'importantes analyses en aval. Le cours consacre environ un tiers de son temps à discuter des algorithmes de graphes pour l'assemblage des génomes ainsi que de la structure d'index pour la cartographie des données de séquençage de la prochaine et de la troisième génération. Nous présenterons ensuite des méthodes d'annotation, d'alignement et de recherche de motifs et consacrerons une partie à la phylogénomique. Un autre domaine d'intérêt est l'analyse des expériences basées sur le séquençage de l'ARN, afin de révéler la structure et les interactions des ARN. Nous nous pencherons ici sur la combinaison de la structure de l'ARN et de la prédiction des interactions, en insistant sur leur intégration avec les données expérimentales. De plus, nous discuterons des applications des techniques d'apprentissage automatique dans l'analyse, par exemple les méthodes de noyaux spécialisés.




In this class, we introduce fundamental bioinformatics technology for analysing sequencing data. Our focus will be on understanding fundamental computer science methods behind direct processing and important downstream analysis. Thus, the class takes about one third of its time to discuss graph algorithms for the assembly of genomes as well as index structure for the mapping of next and 3rd generation sequencing data. We will then introduce methods for annotation, alignment and motif finding as well as spend one unit on phylogenomics. As another focus area, we turn to the downstream analysis of RNA-seq based experiments, in order to reveal the structure and interactions of RNAs. Here, we will dive into combinatorics of RNA structure and interaction prediction, emphasizing their integration with experimental data. Moreover, we discuss applications of machine learning techniques in down-stream analysis, e.g. specialized kernel methods.