Abstrait

Méthode combinée SVM-PLS pour prédire les activités œstrogéniques des produits chimiques organiques dans les eaux côtières

Fei Li, Lulu Cao, Huifeng Wu, Jianmin Zhao

Un ensemble de données de 517 produits chimiques naturels, synthétiques et environnementaux appartenant à une large gamme de classes structurelles a été testé pour les activités œstrogéniques (exprimées en logREC10) sur le récepteur des œstrogènes (ER) à l'aide d'un test à double hybride de levure. Dans cette étude, les relations quantitatives structure-activité (QSAR) ont été déterminées à l'aide de deux méthodes, la méthode des moindres carrés partiels (PLS) et la machine à vecteurs de support (SVM). Le Q2 ​​cum du modèle PLS est de 0,678, ce qui indique une grande robustesse et une bonne capacité prédictive. Le coefficient de corrélation (R) entre les valeurs observées et prédites est de 0,870, ce qui indique que les valeurs prédites par les modèles QSAR finaux concordent bien avec les valeurs expérimentales correspondantes. Huit descripteurs DRAGON ont été inclus dans le modèle PLS, dont Mor03p, L3e, R8p, RTv+ , R8e, R1p+ , R7p+ et HATSv , ce qui implique que les activités chimiques œstrogéniques sont liées aux propriétés atomiques (électronégativités atomiques de Sanderson, polarisabilités et volumes de van der Waals). La comparaison des résultats obtenus à partir de deux modèles a montré que la méthode SVM présentait les meilleures performances globales, avec une erreur RMS de 0,145 unités logREC10 pour l'ensemble. De plus, trois modèles QSAR linéaires ont été construits pour certaines familles spécifiques en fonction de leurs structures chimiques. Ces modèles prédictifs devraient être utiles pour identifier rapidement les produits chimiques potentiellement perturbateurs endocriniens œstrogéniques.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié