Les chaînes polypeptidiques étudiées ont des longueurs variables : leur comparaison ne peut donc se faire que par alignement avec discontinuités.
Le repérage de la position d'un acide aminé dans une séquence est réalisé en ne prenant en compte que les acides aminés et non les discontinuités générées par le traitement pour créer l'alignement optimal. Ainsi l'histidine en position 17 chez Rhodopseudomonas est en position 19 chez Paracoccus et 18 chez les Eucaryotes.
L'une des conséquences de ce traitement est que, si on aligne plusieurs protéines apparues à des périodes très éloignées dans le temps, le pourcentage d'acides aminés identiques est faible (exemple : 3% sur l'ensemble des séquences). Il reflète en fait les acides aminés invariants. Ce qui est frappant, c'est que ces quatre acides aminés, quelle que soit leur place dans la séquence, ont entre eux le même intervalle (sauf pour Rhodopseudomonas et Paracocus) et qu'ils sont positionnés de la même façon dans la structure tridimensionnelle.
Ce faible pourcentage constaté n'est pas en contradiction avec l'homologie entre protéines : ainsi la comparaison entre Vertébrés révèle 81% d'identité, entre Eucaryotes 51%, entre un Eucaryote (ex : Thon) et un Procaryote (ex : Rhodpseudomonas) 35%.( A noter que la comparaison entre 60 espèces d'Eucaryotes donne 27% d'identité !).