Apprentissage statistique et modélisation des systèmes biologiques

Capture

Thomas Walter Chef d'équipe

De nombreuses technologies récentes permettent d’observer les organismes vivants à une échelle jusqu’alors inexplorée. Par exemple, les techniques de biopuces ou de séquençage massivement parallèle permettent de lire l’information génétique complète d’un échantillon biologique ; la spectrométrie de masse permet de quantifier le protéome ; la vidéo-microscopie à haute résolution permet de suivre les évolutions de populations de cellules ; et les méthodes de criblage à haut débit sont utilisées pour caractériser les effets biologiques de grandes quantités de molécules. Enfin, les dossiers patient électroniques contiennent de grands volumes de texte, d’images, ou de résultats d’analyses qui décrivent la dynamique du diagnostic et de la réponse au traitement.

Toutes ces technologies génèrent de très grandes quantités de données, qu’il est souvent difficile d’interpréter directement. Afin de mieux exploiter ces masses de données et d’en extraire des informations biologiques et médicales pertinentes, notre équipe développe des méthodes mathématiques et des algorithmes innovants, basés sur notre expertise en modélisation mathématique, statistique, apprentissage automatique, bioimage informatics et biologie structurale.

Nous développons de nouveaux outils pour examiner différentes questions biologiques et médicales, notamment:

  • Biologie et biologie des systèmes in silico : Nous développons des approches innovantes pour la reconstruction statistique de réseaux biologiques, l’analyse et la modélisation de la progression tumorale au niveau génomique, transcriptomique et épigénétique, l’annotation automatique de gènes et d’éléments fonctionnels par intégration de données hétérogènes et complexes, en particulier les données provenant de séquençage à haut débit ou de vidéo-microscopie.
  • Médecine prédictive et de précision : Nous développons des méthodes pour la classification de tumeurs et l’identification de biomarqueurs diagnostiques, pronostiques et prédictifs de réponse à un traitement. Ces classifieurs utilisent un grand nombre de paramètres mesurables comme les données cliniques du patient, l’ensemble des mutations somatiques de la tumeur, l’expression de gènes et de transcrits alternatifs, ou les modifications structurelles de l’ADN, et sont construits grâce à des méthodes d’apprentissage statistique en grande dimension.
  • Développement de médicaments : nous développons de nouvelles méthodes pour le criblage virtuel et la chémogénomique in silico, afin d’aider à identifier ou créer de petites molécules capables de se lier spécifiquement à des cibles thérapeutiques par modélisation informatique. Ces méthodes combinent des modèles basées sur la représentation sous forme de séquence, de graphe, ou d’information 3D des molécules et des procédures statistiques innovantes, et peuvent par exemple aider à prédire les cibles thérapeutiques, les profils d’activité ou les effets indésirables de candidats médicaments.
Data, machine learning, applications.

Le machine learning permet d’utiliser de nombreux types de données pour des applications en imagerie biomédicale, biologie des systèmes, conception de médicaments, et médecine de précision.

Publications clés

Année de publication : 2020

Racha Chouaib, Adham Safieddine, Xavier Pichon, Arthur Imbert, Oh Sung Kwon, Aubin Samacoits, Abdel-Meneem Traboulsi, Marie-Cécile Robert, Nikolay Tsanov, Emeline Coleno, Ina Poser, Christophe Zimmer, Anthony Hyman, Hervé Le Hir, Kazem Zibara, Marion Peter, Florian Mueller, Thomas Walter, Edouard Bertrand (2020 Aug 14)

A Dual Protein-mRNA Localization Screen Reveals Compartmentalized Translation and Widespread Co-translational RNA Targeting.

Developmental cell : 773-791.e5 : DOI : S1534-5807(20)30584-0

Année de publication : 2019

Collier Olivier, Stoven Véronique, Vert Jean-Philippe (2019 Sep 25)

A Single- and Multitask Machine Learning Algorithm for the Prediction of Cancer Driver Genes

Plos Computational Biology
Slim L., Chatelain C., Azencott C.A., Vert J.P. (2019 Jun 1)

kernelPSI: a Post-Selection Inference Framework for Nonlinear Variable Selection

International Conference on Machine LearningInternational Conference on Machine Learning : 5857-5865
Mélanie Durand, Thomas Walter, Tiphène Pirnay, Thomas Naessens, Paul Gueguen, Christel Goudot, Sonia Lameiras, Qing Chang, Nafiseh Talaei, Olga Ornatsky, Tatiana Vassilevskaia, Sylvain Baulande, Sebastian Amigorena, Elodie Segura (2019 May 11)

Human lymphoid organ cDC2 and macrophages play complementary roles in T follicular helper responses.

The Journal of experimental medicine : DOI : jem.20181994
Peter Naylor, Marick Lae, Fabien Reyal, Thomas Walter (2019 Feb 5)

Segmentation of Nuclei in Histopathology Images by Deep Regression of the Distance Map.

IEEE Transactions on Medical Imaging : 448-459 : DOI : 10.1109/TMI.2018.2865709

Année de publication : 2018

Aubin Samacoits, Racha Chouaib, Adham Safieddine, Abdel-Meneem Traboulsi, Wei Ouyang, Christophe Zimmer, Marion Peter, Edouard Bertrand, Thomas Walter, Florian Mueller (2018 Nov 4)

A computational framework to study sub-cellular RNA localization.

Nature Communications : 4584 : DOI : 10.1038/s41467-018-06868-w
toutes les publications