MGPS & l'INRA
The microbiota in human health
and well being.

InfoBioStat

La plateforme InfoBioStat occupe une place centrale dans nos activités de R&D dans les domaines de la métagénomique quantitative (analyse quantitative des gènes et espèces présents dans la flore bactérienne intestinale) et de la métagénomique fonctionnelle (analyse des mécanismes d'interaction entre le microbiote et l'hôte).

En collaboration avec les trois autres plateformes de l’unité -  Sambo, MetaQuant et MetaFun - InfoBioStat développe une forte expertise dans l’analyse du potentiel génétique  du microbiote humain, dans la santé et la maladie, et la modélisation de sa diversité et sa dynamique pour 

 

Stratifier les individus selon la composition de leur microbiote

identifier des biomarqueurs spécifiques d'un état de santé donné

modéliser in silico des tests de diagnostique et de pronostique

Des outils et technologies informatiques de pointe sont nécessaires pour traiter et analyser les très larges volumes de données générées par les approches de métagénomique. Dans ce contexte, InfoBioStat met en oeuvre une infrastructure optimisée pour


le stockage de données de type Big Data

la sécurisation des données

l‘accès des données à très haut-débit

le calcul informatique haute performance (HPC)

la gestion de bases de données (relationnelles et/ou analytiques en temps réél)

le développement de logiciels dans un contexte d’industrialisation des processle développement pour les analystes de la plateforme d’outils adaptés au big data utilisant les architectures GPU/HPC/Xeon Phi

Notre savoir-faire est attesté par différents logiciels développés par InfoBioStat

 

Meteor, pour l'analyse primaire des données de séquençage : construction de catalogue de gènes métagénomiques et livraison de profiles d'abondance de gènes dans les écosystèmes ((APP IDDN.FR.001.420008.000.R.P.2013.000.30000)

MetaOMineR: une suite logicielle spécifiquement développée pour l'exploration et l’analyse statistiques des données de métagénomique à partir des profiles d’abondance de gènes : identification de biomarqueurs, exploration des écosystèmes, modélisation de tests diagnostiques et pronostiques dans le contexte de maladies, et  intégration de métadonnées (données cliniques par exemple) (APP IDDN.FR.001.220005.000.R.P.2014.000.10000)

MetaProf, pour la structuration des catalogues de gènes métagénomiques en catalogue d’espèces métagénomiques (MGS) via un calcul haute performance des corrélations deux-à-deux des profiles d’abondance des gènes (.IDDN.FR.001.420007.000.R.P.2013.000.20900)

Les développements que nous réalisons sont basés sur les principes suivants : 

 

Livraison des traitements (analyses et rapports) suivant un calendrier fixé avec nos clients

assurance qualité

accès au Big Data par le client

 

L'ensemble des expertises rassemblées dans l'équipe InfoBioStat participe à un très grand nombre de projets et a contribué aux publications  les plus marquantes de MGP.

Notre infrastructure est maintenue et mise à niveau grâce à une veille technologique permanente et à notre participation dans des réseaux collaboratifs rassemblant les spécialistes du domaine comme en particulier:

 

OpenGPU (2010-2012), qui nous a permis de développer des outils de calculs basés sur les GPU. L’orchestration des traitements informatiques est assurée par le logiciel ProActive et nécessite un partenariat avec la société éditrice du logiciel ActiveEON établi depuis 2007. Avec l’évolution des capacités des instruments de production de données métagénomiques générant des ensembles de données encore plus larges, la plateforme prépare le futur et son évolution.  De manière à anticiper ce changement d'échelle et pouvoir traiter jusqu'à 4000 échantillons conjointement, nous développons un nouveau modèle de base de données avec la société ParStream . Afin d'augmenter le potentiel du langage R pour les analyses de ce type de données, nous participons au projet MACH (MAssive Calculations on Hybrid systems) du programme ITEA3 dont un objectif est de développer un compilateur ‘R’ avec un nouvel IDE associé ayant pour cible des architectures data-parallèles comme le GPU ou le Xeon PHI.

L'équipe - Publications - Contact