Topic outline

  • SAMSON-UFF

    Vous voulez développer vos compétences en data science, machine learning et deep learning pour la santé, l'énergie, l'électronique, etc.?

    Vous voulez apprendre le C++ ou progresser en C++ dans un contexte scientifique fort? 

    Vous voulez en apprendre davantage sur la révolution des nanosciences ? 

    Vous voulez savoir comment seront conçus les nano-objets de demain ? 

    Vous aimez l’informatique, mais aussi la biologie, la physique et la chimie ?

    Le but de ce modal est de donner un aperçu des recherches et développements modernes en algorithmique pour les nanosciences en C++.

    Les nanosciences et nanotechnologies suivent une évolution semblable à celle qu’ont connu les macrosciences et macrotechnologies : de même que les avions, bateaux, voitures, etc., sont désormais conçus et simulés par ordinateur, la conception des médicaments, des matériaux, des composants électroniques, etc. repose elle aussi de plus en plus sur des méthodes numériques sophistiquées.

    Les sujets abordés incluent par exemple la simulation dynamique moléculaire (en particulier la simulation interactive), les méthodes de Monte-Carlo, l’optimisation de structures, le calcul d’interactions moléculaires, et le calcul de fonctions d’onde en mécanique quantique, mais aussi les interfaces utilisateurs (Leap motion, réalité augmentée, etc.). L’accent est mis sur les aspects algorithmiques de ces sujets (structures de données, optimisation, calcul haute performance, etc.), ainsi que sur leurs applications à tous les domaines concernés par les nanosciences (biologie, physique, chimie, électronique, conception de médicaments, de matériaux, de composants électroniques, etc.).

    Chaque séance est consacrée à un aspect de l’algorithmique pour les nanosciences, et comporte deux heures de cours et deux heures de pratique effectuées à l’aide de la plateforme logicielle SAMSON. En particulier, les élèves développeront des modules pour SAMSON (des apps, des éditeurs, des modèles 3D, etc.), qu'ils pourront diffuser sur SAMSON Connect (https://www.samson-connect.net).

    En 2016-2017 (sigle précédent INF473S), les élèves ont réalisé des modules de deep learning pour simuler le repliement de protéines.

    En 2017-2018, les élèves ont réalisé des modules de deep learning pour prédire où un médicament peut s'associer à une protéine (image ci-dessous). 

    Active site prediction in SAMSON

    Prédiction des sites actifs dans une protéine par du deep learning. Dans l'exemple ci-dessus, les algorithmes développés par les élèves prédisent à quel endroit un ligand (petite molécule représentée par ses atomes et liaisons atomiques) a le plus de chances de se lier à la protéine (représentée sous forme de surface). La prédiction se fait à partir de la protéine seule. Plus la surface est rouge, plus la probabilité prédite est élevée. La validation se fait sur des complexes protéine-ligand connus. Dans l'exemple ci-dessus, le ligand se situe effectivement dans une des zones prédites comme étant les plus actives par le réseau de neurones.

    Le projet développé par les élèves a été constitué des étapes suivantes:

    - Réalisation d'un module SAMSON pour l'analyse de complexes protéines-ligands connus et production de données d'entrées pour l'entraînement des algorithmes de deep learning

    - Développement et entraînement d'un reseau de neurones convolutionnel (CNN) sous TensorFlow

    - Réalisation d'un module SAMSON pour la visualisation de la prédiction du réseau de neurones


    Pour plus d'informations

    - SAMSON Connect : pour télécharger SAMSON, les SAMSON Elements et le SDK de SAMSON

    - SAMSON on YouTube : tutoriels pour utilisateurs et développeurs

    - SAMSON on GitHub : exemples de code source

    - TensorFlow : le framework de deep learning de Google

    - INF473S - X15 : le projet des élèves en 2016-2017

    INF473N - X16 : le projet des élèves en 2017-2018