Encyclopedie van de evolutiebiologie

Prof. Nico M. van Straalen (2019)

Gepubliceerd op 12-08-2019

Bootstrapping

betekenis & definitie

Het toepassen van numerieke hermonstering om de betrouwbaarheid van clades te onderzoeken bij het maken van een evolutionaire stamboom

Stel dat men met DNA-sequenties van een aantal soorten een stamboom heeft gemaakt. Daarbij is een bepaald optimalisatiecriterium gebruikt (bijvoorbeeld maximum parsimonie) zodat deze boom als meest waarschijnlijk gepresenteerd kan worden. Maar daarmee is nog niet gezegd hoe betrouwbaar die boom is. Om daarover een uitspraak te doen past men “hermonstering met teruglegging” toe. Dat wil zeggen: je kiest uit een alignment van DNA-sequenties een serie homologe nucleotiden, legt die weer terug en kiest er weer een stel, totdat je net zoveel posities hebt getrokken als in de oorspronkelijke alignment. Met de gehermonsterde sequenties maak je een boom. Daarna herhaal je dit 500 tot 1000 maal. Vervolgens kijk je hoeveel keer een bepaalde clade gevonden wordt. Dit getal, als percentage uitgedrukt, is de bootstrap-waarde van die clade. Over het algemeen wordt 80% als grens aangehouden: daaronder wordt een clade niet betrouwbaar gevonden.

Bootstrapping is zeer rekenintensief omdat dezelfde procedure (die vaak al intensief is) een groot aantal malen moet worden herhaald.

Bootstrapping is een algemeen principe uit de statistiek. Een vergelijkbare methode is het toepassen van een “jacknife”, d.w.z. de gegevens in een groot aantal partjes verdelen, deze herhaaldelijk lukraak samenvoegen en voor elke samenvoeging de schatters uitrekenen.

Het woord “bootstrapping” wordt vaak etymologisch verklaard vanuit het verhaal van baron Von Münchhausen (Raspe, 1785), die zichzelf uit het moeras omhoog getrokken zou hebben aan zijn laarsriemen (maar in het werkelijke verhaal trekt Von Münchhausen zichzelf omhoog aan zijn haar). Het woord “booten” (starten vanuit niks) van een computer heeft dezelfde oorsprong.