Aaneenschakelijking van meerdere DNA-sequenties uit hetzelfde genoom tot één lange sequentie te gebruiken in een alignment voor een fylogenetische reconstructie
In een fylogenetische analyse worden homologe DNA-sequenties van verschillende soorten onder elkaar gezet en in een alignment zodanig ten opzichte van elkaar verschoven dat de sequenties in zoveel mogelijk posities hetzelfde zijn. De verschillen tussen soorten (SNPs, indels, microsatellieten) die dan zichtbaar worden dienen als basis voor de reconstructie van een moleculaire stamboom.
Voor deze operatie is het nodig dat de DNA-sequenties homoloog zijn, d.w.z. zodanig veel op elkaar lijken dat verondersteld mag worden dat ze een gemeenschappelijke voorouder hebben. Om de betrouwbaarheid van de analyse te vergroten wil je dit graag doen met meerdere genen, maar die liggen over het algemeen op verschillende plaatsen in het genoom. Wat men nu doet is de sequenties van die genen per soort kunstmatig achter elkaar zetten, wat resulteert in één geconcateneerde sequentie per soort (een concatemeer). Daarmee maak je dan het alignment en de fylogenie.
Concatenatie wordt gezien als een robuuste techniek, vooral als de homologieën van de verschillende genen goed vast te stellen zijn en ze allemaal ongeveer hetzelfde evolueren, bijvoorbeeld tot dezelfde familie behoren, zoals ribosomale eiwitten of histonen.
Een alternatief voor een geconcateneerde analyse is een meervoudig alignment (“multiple sequence alignment”, MSA). Dan maak je eerst fylogenieën per gen en distilleert daaruit een species-fylogenie via “reconciliatie”.
Geconcateneerde alignments, MSA, e.d., zijn bioïnformatische technieken die liggen tussen de klassieke, op één gen gebaseerde fylogenie en de fylogenomica, die het hele genoom tegelijk neemt. Bij meervoudige sequenties worden meestal aanvullende veronderstellingen gedaan over variatie in de substitutiefrequenties (zie de lemma’s heteropecillie en heterotachie).