Bernard Ycart, Konstantina Charmpi, Sophie Rousseaux et Jean-Jacques Fournié
Le problème abordé ici est celui du traitement simultané de plusieurs jeux de données d'expression génétique, éventuellement collectés dans des conditions expérimentales et/ou sur des plateformes différentes. À l'aide de statistiques robustes, une analyse statistique à grande échelle a été menée sur 20 jeux de données téléchargés à partir du référentiel Gene Expression Omnibus. Les différences entre les jeux de données sont comparées à la variabilité au sein d'un jeu de données donné. Des preuves sont fournies que des informations biologiques significatives peuvent être extraites en fusionnant différentes sources.