Yosuke Kondo et Satoru Miyazaki*
Jusqu'à présent, afin de prédire les sites importants d'une protéine, de nombreuses méthodes informatiques ont été développées. À l'ère du big data, il est nécessaire d'améliorer et de perfectionner les méthodes existantes en intégrant les données de séquence dans les données structurelles. Dans cet article, nous visons deux choses : améliorer les méthodes basées sur la séquence et développer une nouvelle méthode utilisant à la fois les données de séquence et de structure. Par conséquent, nous avons développé une méthode de trace évolutive modifiée à l'origine, dans laquelle nous avons défini des grades conservateurs calculés à partir d'un alignement de séquences multiples donné et un grade proximal afin d'évaluer les sites actifs prédits du point de vue de l'interaction protéine-ion, protéine-ligand, protéine-acide nucléique, protéine-protéine en utilisant des structures tridimensionnelles. En d'autres termes, le grade proximal peut également évaluer un résidu d'acide aminé. Lorsque nous avons appliqué notre méthode aux protéines Tu/1A, facteur d'élongation de la traduction, elle a montré que les grades conservateurs sont évalués avec précision par le grade proximal. Par conséquent, notre idée a indiqué deux avantages. L'un est que nous pouvons prendre en compte diverses structures de cocristal pour l'évaluation. Une autre solution est que, en calculant l’adéquation entre la note conservatrice donnée et la note proche, nous pouvons sélectionner la meilleure note conservatrice.