Christelle Reynes, Leslie Regad, Robert Sabatier et Anne-Claude Camproux
La prédiction de motifs structuraux particuliers associés à des fonctions biologiques ou à la structure est d'une importance capitale. Étant donné la disponibilité croissante de séquences primaires sans aucune information de structure, les prédictions à partir de séquences d'acides aminés (AA) sont essentielles. La méthode de prédiction de motifs structuraux proposée est une approche en deux étapes basée sur un alphabet structural. Cet alphabet permet de coder n'importe quelle structure 3D en une séquence 1D de lettres structurales (SL). Tout d'abord, les règles de correspondance de base entre AA et SL sont apprises par programmation génétique. Ensuite, un modèle de Markov caché est appris pour chaque motif d'intérêt préalablement identifié. Enfin, une probabilité de correspondre à un motif 3D donné pour une séquence d'acides aminés donnée est fournie. La méthode est appliquée sur des sites de liaison à l'ATP pour comparer l'efficacité de notre méthode à d'autres pour une fonction classique. Ensuite, la capacité de la méthode à apprendre des motifs correspondant à des fonctions plus rarement prédites ou à d'autres types de motifs est illustrée.