Des outils bioinformatiques récemment développés permettent d’obtenir une résolution au niveau de la souche en identifiant des gènes accessoires ou en capturant des variantes de nucléotides (SNP). Cependant, ces outils sont entravés par l’étendue des génomes de référence disponibles qui sont loin de couvrir toute la variabilité microbienne. La création de catalogues de gènes non redondants par assemblage de novo suivi d’un regroupement de gènes co-abondants permet de révéler une partie de la matière noire microbienne en reconstituant le répertoire de gènes d’espèces potentiellement inconnues. Si les méthodes existantes identifient avec précision les gènes centraux présents dans toutes les souches d’une espèce, elles omettent de nombreux gènes accessoires ou les divisent en petits groupes de gènes qui restent non associés aux génomes centraux. Cependant, la capture de ces gènes accessoires est essentielle en recherche clinique et en épidémiologie car ils assurent des fonctions spécifiques à certaines souches, telles que la pathogénicité ou la résistance aux antibiotiques.
Nous proposons une nouvelle méthode bioinformatique appelée MSPminer, qui, en combinant les informations provenant de centaines d’échantillons métagénomiques, a permis de reconstituer le répertoire de gènes de plus de 1600 espèces du microbiome intestinal humain, dont plus de 70% étaient auparavant inconnues. Les pan-génomes des espèces métagénomiques (MSP) capturent et distinguent non seulement les gènes principaux mais aussi les gènes accessoires des espèces microbiennes.
Ce travail fournit une cartographie détaillée de la composition du microbiome intestinal et de sa variabilité inter-individuelle, ouvrant la voie à une meilleure compréhension du lien entre le microbiome et les maladies.
https://academic.oup.com/bioinformatics/article/35/9/1544/5106712