Yaofeng Wang, Alex Chun Cheung, Jun-Tao Guo et Bo Feng
La découverte de cellules souches embryonnaires pluripotentes (CSE) chez les mammifères a considérablement transformé la recherche sur les cellules souches et la médecine régénérative. Pour comprendre le mécanisme moléculaire de la pluripotence, les technologies de séquençage massif ont été adoptées avec un intérêt scientifique intense en raison de leurs avantages, notamment une haute résolution, un faible bruit, ainsi que leur couverture étendue sur l'ensemble du génome. Nous passons ici en revue les principes des technologies de séquençage massif du génome entier largement utilisées dans les études sur les CSE, notamment ChIP-Seq, RNA-Seq et methylCSeq. Les améliorations et applications récentes de ces technologies seront également abordées. En outre, un résumé des différentes méthodologies utilisées pour intégrer les données massives de séquençage du génome entier sera présenté. L'intégration des données massives qui délimitent différents aspects des CSE peut susciter de nombreuses innovations pour comprendre les réseaux de transcription dans le maintien de la pluripotence ainsi que les régulations génétiques et les modifications épigénétiques dans les CSE, qui sont importantes pour la recherche et les applications cliniques. De plus, nous soulignons les caractéristiques qui méritent l’attention des biologistes en raison des défis actuels de l’analyse massive des données de séquençage en bioinformatique et en biostatistique.