Sally Yepes et Maria Mercedes Torres
Étant donné l’hétérogénéité du comportement clinique des patients atteints de cancer ayant un diagnostic histopathologique identique, la recherche de sous-types moléculaires non reconnus, de marqueurs spécifiques aux sous-types et l’évaluation de leur pertinence clinico-biologique sont une nécessité. Cette tâche bénéficie aujourd’hui des technologies génomiques à haut débit et de l’accès gratuit aux ensembles de données générés par les projets génomiques internationaux et aux référentiels d’informations. Les stratégies d’apprentissage automatique se sont avérées utiles pour identifier les tendances cachées dans de grands ensembles de données, contribuant à la compréhension des mécanismes moléculaires et du sous-typage du cancer. Cependant, la traduction de nouvelles sous-classes moléculaires et de nouveaux biomarqueurs dans des contextes cliniques nécessite leur validation analytique et des essais cliniques pour déterminer leur utilité clinique. Nous donnons ici un aperçu du flux de travail pour identifier et confirmer les sous-types de cancer, résumons une variété de principes méthodologiques et mettons en évidence des études représentatives. La génération de big data publiques sur les tumeurs malignes les plus courantes transforme la pathologie moléculaire en une discipline axée sur les bases de données.