Alberto Meseguer, Ruben Molina-Fernández, Narcis Fernández-Fuentes, Oriol Fornes*, Baldo Oliva*
Dans le travail intitulé « Sur la prédiction des préférences de liaison à l'ADN des domaines C2H2-ZF à l'aide de modèles structurels : application sur le CTCF humain », nous présentons une nouvelle méthode de calcul pour prédire les préférences de liaison à l'ADN pour les domaines protéiques à doigt de zinc Cis2-His2 (C2H2-ZF) à partir de leur séquence ou structure d'acides aminés. La méthode utilise les structures des complexes protéine-ADN pour calculer un ensemble de potentiels statistiques basés sur la connaissance. Étant donné le faible nombre de complexes protéine-ADN de structure connue, nous complétons l'ensemble de structures avec des interactions expérimentales entre levures et un hybride de plus de 170 000 domaines C2H2-ZF conçus par séquence. Nous avons mis en œuvre un serveur pour modéliser la structure de tout complexe protéine-ADN de cette famille et dériver sa matrice de pondération de position théorique basée sur les meilleurs scores d'interactions calculés avec les potentiels statistiques. L'approche est validée et appliquée à la séquence humaine du CTCF.