NL FR EN
www.belgium.be

Bioinformatique et modélisation: des génomes aux réseaux

Projet de recherche P6/25 (Action de recherche P6)

Personnes :

Description :

Au cours de la dernière décennie, la biologie a fait face à une révolution technologique suite au développement de méthodes à haut débit permettant la caractérisation des séquences génomiques, du transcriptome et du protéome menant à une accumulation considérable de données biologiques. Cependant, cette révolution technologique commence seulement à se traduire en une révolution scientifique et nous sommes encore loin de comprendre le fonctionnement d’un génome, même pour les organismes modèles les plus simples et les mieux caractérisés. Outre les problèmes liés à la relativement mauvaise qualité des données à haut débit, un obstacle important provient de la complexité inhérente aux processus biologiques, dont les propriétés émergentes ne peuvent se réduire à la simple somme des propriétés individuelles de leurs composantes. Le domaine de la modélisation dynamique a une longue tradition d’analyse de systèmes complexes. Cependant, ce domaine est généralement restreint à l’étude de petits réseaux dont les paramètres sont définis précisément. L’intégration de données génomiques, transcriptomiques et protéomiques dans les modèles dynamiques représente actuellement un des défis majeurs de la bioinformatique.
Le but de ce réseau est de rassembler des expertises allant de l’analyse de données à haut débit et du « reverse engineering » à la modélisation dynamique, afin d’établir un lien entre les différents domaines, de façon à offrir un cadre pour l’étude de la biologie de systèmes. Les approches et outils informatiques développés par les équipes respectives seront combinées pour permettre une analyse intégrative de quelques systèmes modèles soigneusement sélectionnés.

Les apports de ce réseau incluent (1) la mise en commun des méthodes et de l’expérience de groupes traditionnellement impliqués dans des domaines complémentaires de l’annotation génomique, de l’analyse des données « omiques » et de la modélisation dynamique, pour construire un schéma d’analyse complet pour des sysèmes biologiques; (2) le développement d’un cadre de travail conceptuel et pratique (logiciel) pour l’intégration des approches de génomique, de bioinformatique et de modélisation; (3) le renforcement de la position et de la visibilité de la Belgique dans ce domaine de recherche actif. En outre, ce réseau permettra d’augmenter la qualité de la formation de nos chercheurs doctorants et post-doctorants.

Le projet est organisé en cinq « workpackages ».

WP1. Annotation et génomique comparative

Le but est d’analyser la structure et l’évolution des génomes, et d’utiliser cette information afin d’identifier les interactions régulatrices entre différents gènes. Ce travail sera organisé selon deux orientations : la première se focalisera sur la structure et l’évolution des génomes (annotation, organisation génomique et génomique comparative ; évolution) tandis que la seconde tentera d’identifier les interactions régulatrices, en particulier en développant des outils d’analyse de séquences pour l’identification d’éléments cis-régulateurs et des fonctions régulatrices des micro - ARN.

WP2. Analyse des données à haut débit

La génomique et la protéomique à haut débit produisent des quantités énormes de données qui requièrent une analyse pour pouvoir en extraire une information biologiquement interprétable. Des méthodes et algorithmes spécifiques seront développés afin de permettre l’analyse de grandes quantités de données provenant des analyses de génotypage, transcriptome, protéome, interactome et métabolome, afin d’identifier ou localiser des gènes, protéines et métabolites impliqués dans des phénotypes ou processus cellulaires d’intérêt.

WP3. Intégration des données

Les méthodes à haut débit constituent un point de départ approprié pour l’identification des gènes ou protéines associés à une voie métabolique, un processus ou une maladie d’intérêt – par exemple, pour l’analyse de réseaux de régulation ou pour certaines applications médicales. Cependant, ces méthodes présentent souvent un taux élevé de faux positifs et de faux négatifs. L’intégration de ces données permet de réduire ces difficultés en recoupant différents types de données de manière à éliminer les incohérences. En particulier, les équipes de recherche développeront des méthodes définissant un ordre de priorité entre gènes, afin d’intégrer des sources de données multiples et d’identifier les meilleurs gènes ou protéines candidats d’un contexte spécifique. Elles développeront également des méthodes pour l’analyse, aux niveaux du transcriptome, protéome, métabolome et interactome, de jeux de données associés à des systèmes biologiques, afin d’identifier des composant potentiels de ces réseaux biologiques.

WP4. Modélisation dynamique et simulation de réseaux

Le premier objectif de cette analyse sera d’analyser et de comparer les modèles déterministes et stochastiques, ainsi que les modèles en temps continu et en temps discret, respectivement. L’accent sera plus particulièrement placé sur l’étude des réseaux de régulations sous-jacents aux rythmes circadiens ainsi que sur ceux impliqués dans les processus de différentiation, d’adaptation et d’utilisation des nutriments. Un angle complémentaire proviendra de l’analyse du rapport entre la topologie des réseaux de régulation et leurs propriétés dynamiques. Le comportement de seuil et les phénomènes oscillatoires dans les réseaux métaboliques impliquant des cascades de phosphorylation-déphosphorylation seront investigués, ainsi que les méthodes d’inférence des réseaux métaboliques.

WP5. Établissement d’un lien entre bioinformatique et modélisation

Il existe un contraste important entre les analyses de données à haut débit et la modélisation quantitative et qualitative de processus spécifiques. Même si l’on suppose une intégration appropriée des données, ce fossé reste important, entre autres parce qu’une modélisation précise n’est possible que pour des systèmes bien caractérisés. Peu d’études ont été menées sur des méthodes qui permettraient de combler ce fossé. Un objectif majeur du projet sera d’avancer dans ce domaine et tous les partenaires se focaliseront sur le développement de méthodes dans ce sens. Pour s’attaquer à ce défi, plusieurs orientations seront envisagées, notamment des techniques de validation de modèles (à la fois pour les modèles dynamiques à temps continu et à temps discret), et des analyses de la robustesse et de la sensibilité des modèles aux données et aux choix des paramètres.

Partenaires européens

Deux partenaires européens (Denis Thieffry, Université de la Méditerranée – Aix-Marseille II, INSERM ERM 206 – TAGC, France & Florence d’Alché-Buc, Laboratoire de Méthodes Informatiques - Équipe BioInfo – Génopole, France) seront étroitement associés au réseau PAI. Ces deux équipes renommées ont été sélectionnées en raison de leur expertise complémentaire à celle des membres du réseau et de collaborations déjà en cours.

Relations avec les réseaux PAI existants

KUL ESAT-SCD et ULg-Systems and Control font partie du réseau PAI dévolu à l’étude des Systèmes et de leur Contrôles. Ce réseau PAI très actif a établi un terrain propice au nouveau domaine de recherche en bioinformatique.

Lien avec la recherche expérimentale

Le réseau n’est pas centré sur l’étude d’un seul système ou processus biologique et aucun travail expérimental n’est donc directement impliqué. Cependant, en se basant sur l’interaction continue avec des biologistes moléculaires, il a été observé que les mêmes questions se reposent fréquemment pour différents organismes et différents problèmes biologiques. En faisant abstraction des spécificités d’un problème biologique, on peut le convertir en une formulation plus générale, qui mène à une solution plus générique. Cette solution peut ensuite être adapté au cas spécifique envisagé. C’est exactement à ce niveau d’abstraction que le réseau sera actif. Plutôt que de déployer des efforts intenses à élaborer des expertises similaires dans chacun des groupes de recherche, les membres veulent partager leurs connaissances bioinformatiques et algorithmiques pour améliorer le rendement des recherches. Toutefois, les membres du réseau sont pleinement conscients de l’importance des travaux expérimentaux pour s’attaquer à des problèmes biologiques et biotechnologiques concrets, pour générer des jeux de données cohérents, pour valider les modèles computationnels de la biologie des systèmes, et comme base de tout travail de modélisation biologique pertinent. Par ailleurs, le développement de méthodes bioinformatiques orientées vers l’exploitation des données expérimentales de génomique et protéomique à haut débit requiert des jeux de données de bonne qualité pour l’investigation et la validation.
Les membres ont des liens étroits avec des expérimentalistes, ce qui offrira une garantie de pertinence, en assurant que les méthodologies développées dans ce réseau traitent des jeux de donnés pertinents, et que les résultats bioinformatiques mènent à leur tour à un travail expérimental.

Les réalisations de cette proposition doivent être interprétées dans le cadre élargi des stratégies de recherche de chacun des partenaires, qui consistent à travailler de manière intégrée à la recherche expérimentale.
Chaque financement existant se situe dans ce cadre de recherche et le financement de travaux expérimentaux est garanti par les projets déjà mis sur pieds.

 VIB-PSB est inclus dans le Department of Plant Systems Biology et ainsi impliqué dans de nombreux projets de recherche fondamentale en botanique.
 L’équipe de la KUL coordonne le K.U.Leuven Center of Excellence on Computational Systems Biology, qui regroupe sept partenaires, dont quatre sont des équipes de recherche biologiques et biomédicales (génétique humaine, endocrinologie, diabète, biologie de la Salmonelle). Elle est aussi partenaire du service ProMeta (Protéomique et Métabolomique) de la K.U.Leuven.
 Le partenaire ULg est membre de la Grappe interdisciplinaires de Génoprotéomique Appliquée (GIGA), un Centre d’Excellence qui rassemble les groupes de recherche de pointe en biologie moléculaire et en génétique de l’Université de Liège.
 L’équipe de l’ULB est membre de plusieurs réseaux financés par l’Union Européenne, la Région Wallonne et la Communauté Française de Belgique, qui s’articulent autour de collaborations étroites entre biologistes expérimentaux et théoriciens.

Documentation :