Andrey V Lisitsa, Ekaterina V Poverennaya, Elena A Ponomarenko et Alexander I Archakov
Le séquençage du génome entier a révélé le nombre de gènes codant pour des protéines dans un organisme donné, ce qui peut être considéré comme une première approximation de la complexité moléculaire. En raison des modifications post-transcriptionnelles et post-traductionnelles telles que l'épissage de l'ARN, les polymorphismes, les modifications covalentes et la dégradation, le nombre total d'espèces protéiques différentes (le protéome) peut être bien supérieur au nombre de gènes codant pour les protéines. L'électrophorèse sur gel 2D peut être utilisée pour estimer la largeur du protéome humain. Le nombre de taches obtenues avec différents colorants dans différentes conditions de charge protéique peut donner une idée approximative du nombre de protéines différentes dans l'échantillon. Des données sur le plasma humain, les lignées cellulaires et les cellules bactériennes ont été étudiées pour déterminer la dépendance du nombre de taches sur la sensibilité au colorant. En supposant que chaque tache représente une espèce protéique différente, la dépendance des taches à la sensibilité a été appliquée comme estimation de la largeur du protéome. En théorie, il y a 1,75 million de protéoformes dans 1 L de plasma sanguin, 18 000 espèces par cellule HepG2 individuelle et 6 700 espèces par bactérie.