Rong Xu et Quanqiu Wang
La médecine personnalisée consiste à délivrer le bon médicament au bon patient à la bonne dose. La pharmacogénomique (PGx), les études visant à identifier les variantes génétiques susceptibles d'affecter la réponse aux médicaments, est importante pour la médecine personnalisée. Les approches informatiques visant à étudier les relations entre les gènes et la réponse aux médicaments émergent comme un domaine de recherche actif pour la médecine personnalisée. Actuellement, l'étude systématique des relations médicament-gène est limitée car une base de connaissances à grande échelle sur les relations médicament-gène compréhensible par machine est difficile à créer et à maintenir à jour. La littérature scientifique contient de nombreuses informations sur les relations médicament-gène et constitue donc la source de connaissances ultime pour les études PGx et pour la médecine personnalisée. Cependant, ces informations sont en grande partie enfouies dans du texte libre avec une compréhensibilité limitée par machine. Il est nécessaire de développer des approches automatiques pour extraire les relations médicament-gène structurées de la littérature biomédicale. Dans cette étude, nous présentons une approche semi-supervisée pour extraire les relations médicament-gène de MEDLINE. La technique utilise un modèle de départ et apprend de manière itérative différentes manières dont la relation peut être exprimée dans 20 millions de résumés MEDLINE. Notre approche a atteint des précisions élevées (0,961-1,00) dans l'extraction des relations médicament-gène de MEDLINE et a trouvé de nombreuses paires médicament-gène qui ne sont pas disponibles dans PharmGKB, une base de connaissances PGx à grande échelle organisée manuellement.