JaeJin Choi, Byung-Ju Kim, Sung-Hou Kim
Contexte : Un « arbre d’organismes » d’insectes, le groupe le plus grand et le plus diversifié en espèces de tous les animaux vivants, peut être considéré comme un arbre métaphorique et conceptuel pour capturer un récit simplifié des parcours évolutifs complexes et imprévisibles des insectes existants. Actuellement, l’approche la plus courante consiste à construire un « arbre génétique », en tant que substitut de l’arbre d’organismes, en sélectionnant un groupe de régions hautement alignables de chacun des gènes/protéines sélectionnés pour représenter chaque organisme. Cependant, ces régions sélectionnées ne représentent qu’une petite fraction de tous les gènes/protéines et une fraction encore plus petite du génome entier d’un organisme. Au cours des dernières décennies, les séquences du génome entier de nombreux insectes existants sont devenues disponibles, offrant la possibilité de construire un « arbre du génome entier ou du protéome entier » d’insectes en utilisant la théorie de l’information sans alignement de séquence (méthode sans alignement).
Résultats : Un arbre protéomique complet des insectes montre que (a) le modèle de regroupement démographique est similaire à celui des arbres génétiques, mais il existe des différences notables dans les ordres de ramification des groupes, donc dans les relations de fraternité entre les paires de groupes ; et (b) tous les fondateurs des groupes majeurs ont émergé dans une « explosion » près de la racine de l'arbre.
Conclusion : Puisque la séquence du protéome entier d’un organisme peut être considérée comme un « livre » d’alphabets d’acides aminés, un arbre de ces livres peut être construit, sans alignement de séquences, en utilisant une méthode d’analyse de texte de la théorie de l’information. Un tel arbre fournit un point de vue alternatif pour construire un récit de l’évolution et de la parenté entre les insectes existants.