Exploitation des données multi-omiques pour élucider les bases génétiques et moléculaires de caractères complexes: Une étude de génétique des systèmes de la réponse du maïs à la sécheresse.
Participer à la réunion Zoom https://inrae-fr.zoom.us/j/5426906103?pwd=OFFwd3dDdFcwK2luSUVwOVdtaTRFUT09 ID de réunion : 542 690 6103 Code secret : D0%QPXdN01
Jury
- Nicolas Langlade, Directeur de Recherche, INRAE - Rapporteur
- Vincent Segura, Chargé de Recherche, INRAE - Rapporteur
- Mikaël Lucas, Chargé de Recherche, IRD - Examinateur
- Élisabeth Petit-Teixeira, Professeure, Université Paris-Saclay - Examinatrice
- Andrea Rau, Directrice de Recherche, Université Paris-Saclay - Examinatrice
Le projet de thèse a été supervisé par
- Mélisande Blein-Nicolas, Ingénieure de Recherche, INRAE - Directrice de thèse
- Marie-Laure Martin, Directrice de Recherche, INRAE - Co-directrice de thèse
Mots clés
biologie des systèmes, génétique d’association, intégration de données multi-omiques, réseaux moléculaires, relation génotype-phénotype, interaction génotype-environnement
Résumé
Bien que les interactions entre la recherche académique et les entreprises semencières au cours du siècle dernier aient permis une avancée significative dans l’amélioration des plantes cultivées , cela fait plusieurs années que les rendements des grandes cultures n’ont pas augmenté de manière significative. De plus, selon le Groupe d’experts intergouvernemental sur l’évolution du climat (GIEC), les émissions de gaz à effet de serre ont déclenché une hausse irréversible des températures qui rendra les terres agricoles plus sèches et augmentera considérablement les mauvaises récoltes au cours des 30 prochaines années. Nourrir près de dix milliards de personnes dans ce contexte de changement climatique est donc l’un des plus grands défis de ce siècle. Parmi les cultures touchées par la sécheresse, le maïs est au centre des recherches visant à améliorer les variétés pour les rendre plus résistantes au stress hydrique. Cependant, la tolérance à la sécheresse est un caractère polygénique (i.e., un caractère contrôlé par plusieurs gènes) qui dépend fortement de l’environnement, ce qui fait de la compréhension de son déterminisme génétique une tâche considérable. En effet, après avoir perçu un stress hydrique, les plantes déclenchent de multiples voies moléculaires affectant leur développement et leur rendement. Grâce aux avancées biotechnologiques, il est possible de générer des ensembles de données multi-omiques permettant d’appliquer des approches de génétique des systèmes dans l’étude de la tolérance à la sécheresse. Ma thèse visait à mieux comprendre les bases génétiques et moléculaires de la réponse du maïs à la sécheresse en réalisant une analyse integrative de données multi-omiques (génomique : un million de SNP, protéomique : 2000 protéines, métabolomique : 1500 métabolites, et phénomique : 6 traits écophysiologiques liés à la sécheresse) mesurées pour 254 hybrides de maïs cultivés sous deux régimes hydriques contrastés. Dans la première partie de la thèse, je me suis concentré sur l’analyse des données phénomiques afin de quantifier la pertinence de l’intégration des indices de plasticité dans les études de génétique d’association pour détecter des QTLs impliqué dans l’interaction génotype-disponibilité en eau (GxW). Le principal résultat de cette partie est que les QTL de plasticité ne se chevauchent pas avec les QTL détectés sur les moyennes phénotypiques, et qu’ils capturent exclusivement une partie importante de la variance GxW (10-70% en fonction des caractères). Outre l’identification de nouvelles régions génétiques potentiellement impliquées dans la réponse à la sécheresse, mes résultats soutiennent le postulat selon lequel la plasticité phénotypique est un caractère indépendant avec son propre déterminisme génétique. Dans la deuxième partie de la thèse, j’ai mené une approche de génétique des systèmes en intégrant les données de génomique, de protéomique et de phénomique pour i) inférer un réseau multi-échelles révélant les bases génétiques et moléculaires de la réponse au stress hydrique, ii) évaluer les apports des données de protéomique pour expliquer la variance GxW, et iii) fournir une annotation fonctionnelle des QTLs maximisant la proportion de variance GxW capturée. Tout d’abord, j’ai pu identifier des régions génomiques enrichies en pQTLs et les traduire en réseaux d’interactions protéine-protéine. Cela m’a permis de montrer que les protéines associées à des pQTLs situés dans ces régions pouvaient interagir physiquement avec des protéines codées par des gènes couverts par ces régions. Deuxièmement, j’ai identifié un ensemble de QTL et de pQTL qui, ensemble, capturent 84% de la variance GxW. Troisièmement, j’ai inféré un réseau multi-échelle comprenant 531 loci, 63 protéines et 6 caractères répondant à la sécheresse. Ces résultats mettent en avant le potentielle des données omiques afin de révéler les bases génétiques et moléculaires de caractères complexes tels que la tolérance à la sécheresse.