26. Spalik, Piwczynski, Rekonstrukcja filogenezy i wnioskowanie filogenetyczne w badaniach ewolucyjnych (2009)(1).pdf

(629 KB) Pobierz
192621719 UNPDF
Tom 58 2009
Numer 3–4 (284–285)
Strony 485–498
K rzysztof s paliK 1 , M arcin p iwczyńsKi 2
1 Zakład Systematyki i Geografii Roślin
Instytut Botaniki
Uniwersytet Warszawski
Aleje Ujazdowskie 4, 00-478 Warszawa
2 Zakład Taksonomii i Geografii Roślin
Instytut Ekologii i Ochrony Środowiska
Uniwersytet Mikołaja Kopernika
Gagarina 9, 87-100 Toruń
E-mail: spalik@biol.uw.edu.pl
piwczyn@umk.pl
REKONSTRUKCJA FILOGENEZY I WNIOSKOWANIE FILOGENETYCZNE W BADANIACH
EWOLUCYJNYCH
DARWIN, HAECKEL I FILOGENEZA
W lipcu 1837 r. Darwin naszkicował w
swoim notatniku schematyczny graf rela-
cji pokrewieństwa między gatunkami, ob-
razujący koncepcję drzewa życia. Ta idea,
ubrana w daleko doskonalszą formę gra-
ficzną, pojawiła się także 22 lata później w
jego rewolucyjnym dziele „O powstawaniu
gatunków”, ale wciąż jako koncept, a nie
konkretne drzewo filogenetyczne, przed-
stawiające zależności ewolucyjne między
gatunkami. Nie ma w tym nic dziwnego —
Darwin zajmował się wyjaśnianiem mecha-
nizmów ewolucji, nie zaś odtwarzaniem jej
przebiegu. Pierwsze drzewo filogenetyczne
pojawiło się w „Generelle Morphologie der
Organismen” Ernsta Heackla w 1866 r. i tę
datę można przyjąć jako oficjalny początek
filogenetyki — gałęzi biologii zajmującej się
rekonstrukcją filogenezy organizmów.
Drzewo filogenetyczne Haeckla było za-
pisem poglądów tego wybitnego uczonego
na pochodzenie organizmów i podsumowa-
niem ówczesnego stanu wiedzy. Jednocze-
śnie było hipotezą naukową, podlegającą
weryfikacji w toku dalszych badań. Jeśli po-
patrzymy na zapisane na nim zależności filo-
genetyczne, to okaże się, że niewiele z nich
zostało poprawnie odtworzonych, a obecny
obraz drzewa życia jest zasadniczo odmien-
ny. Jednak drzewo filogenetyczne nadal po-
zostaje jednocześnie podsumowaniem obec-
nego stanu wiedzy oraz hipotezą badawczą.
W filogenetyce, podobnie jak w każdej na-
uce przyrodniczej, nie ma prawd absolut-
nych, a teorie i hipotezy uznajemy za praw-
dziwe, jeśli nikomu, mimo usilnych prób,
nie udało się ich obalić. Warto pamiętać o
tym zakresie niepewności, jaki towarzyszy
wszystkim prawdom naukowym, a zwłaszcza
dotyczącym odtwarzania przeszłości.
W tym artykule chcielibyśmy skupić się
na metodyce badań filogenetycznych, a tak-
że pokazać, w jaki sposób otrzymane filo-
genezy służą wnioskowaniu ewolucyjnemu.
Chcemy pokazać, że analizy filogenetyczne
bazujące na danych molekularnych, aczkol-
wiek obarczone, jak w wypadku wszystkich
nauk historycznych, nieuniknioną niepew-
nością, wsparte są na solidnych podstawach
naukowych, a wypływające z nich wnioski
nie są gorszej jakości od wniosków z badań
eksperymentalnych.
192621719.001.png
486
K rzysztof s paliK , M arcin p iwczyńsKi
Dwa poDEJŚcia Do KonstrUowania DrzEwa
Istnieje zasadnicza różnica metodologicz-
na między drzewem Haeckla a współczesny-
mi przedstawieniami filogenezy. To pierwsze
było po prostu wyrazem poglądów badacza,
wspartych wprawdzie rzetelną wiedzą i wy-
nikającą z niej intuicją, ale nie powstało ono
w wyniku żadnych określonych procedur.
Współczesne drzewa są natomiast usyskiwa-
ne za pomocą określonych algorytmów ob-
liczeniowych. Wyniki są zobiektywizowane
i powtarzalne, a tym samym weryfikowalne.
Ten przełom w filogenetyce został dokona-
ny dzięki rozwojowi metod numerycznych
oraz wynalezieniu komputerów, a przyniósł
go nurt taksonomii zwany fenetyką, której
„ojcami-założycielami” byli P. H. A. Sneath i
R. R. Sokal. Jest paradoksem, że fenetyka jed-
nocześnie odrzuciła biologiczny sens odtwa-
rzania drzewa życia, a skoncentrowała się na
konstruowaniu zależności wszechstronnego
podobieństwa między organizmami, zakłada-
jąc, że drzewo filogenetyczne wyjdzie mimo-
chodem. Nie czyniła ona żadnych założeń o
przydatności cech, traktując je równocennie.
Odmienne podejście prezentowała klady-
styka, której prekursorem był Willi Hennig.
Ostro krytykowała ona podejście fenetyczne
wskazując, że o pochodzeniu od wspólnego
przodka świadczą jedynie wspólne unikato-
we cechy pochodne ewolucyjnie, czyli sy-
napomorfie, nie zaś cechy homoplastyczne:
pierwotne ewolucyjnie, odziedziczone po od-
ległym przodku (symplezjomorfie) albo po-
wstałe niezależnie (parallelizmy). Rozróżnia
się synapomorfie od homoplazji posługując
się zasadą parsymonii (oszczędności), czyli
wybierając spośród wszystkich możliwych
drzew takie, które wyjaśnia różnorodność
cech na liściach drzewa za pomocą najmniej-
szej liczby zmian na gałęziach, minimalizując
tym samym konflikty cech. Spór między fe-
netyką a kladystyką był niezwykle gwałtow-
ny — dziś emocje opadły, a w efekcie status
obywatelstwa we współczesnej filogenetyce
zyskały sobie koncepcje z obu nurtów. Nikt
dzisiaj nie kwestionuje, że nadrzędnym pro-
blemem badawczym jest rekonstrukcja filoge-
nezy, ale ten cel jest osiągany również za po-
mocą metod bazujących na podobieństwie.
rEwolUcJa MolEKUlarna w filoGEnEtycE
Biologia molekularna, a przede wszyst-
kim rozwój metod łańcuchowej reakcji poli-
merazy (PCR) oraz sekwencjonowania DNA,
zrewolucjonizowała odtwarzanie drzewa ro-
dowego organizmów. Dane z sekwencji oka-
zały się daleko lepszymi znacznikami dla re-
konstrukcji filogenezy niż tradycyjne cechy
morfologiczne, anatomiczne czy biochemicz-
ne. Składa się na to kilka powodów. Przede
wszystkim, dane z sekwencji są genetyczne
— przedstawiają nam od razu zapis informa-
cji w DNA (lub RNA), podczas gdy dane z
budowy organizmów mówią nam o tym zapi-
sie pośrednio. Co gorsza, fenotyp organizmu
jest wypadkową informacji genetycznej oraz
jego interakcji ze środowiskiem zewnętrz-
nym, a określona cecha morfologiczna może
być determinowana przez jeden albo przez
wiele loci. Wnioskowanie o podłożu gene-
tycznym określonej cechy morfologicznej na
podstawie jej zmienności jest zatem obarczo-
ne dużym błędem. Co więcej, aby taką cechę
wykorzystać w analizie komputerowej, mu-
simy jej zmienność zakodować, czyli przed-
stawić w formie liczb lub znaków, a sposób
tego kodowania jest z konieczności arbitral-
ny — natomiast dane z sekwencji nie wyma-
gają kodowania, ponieważ są już zapisane
jako ciąg znaków.
Sekwencje DNA dają nam też niezwykłą
możliwość porównywania ze sobą bardzo
odległych ewolucyjnie organizmów. Przy-
kładowo — trudno na podstawie morfologii
czy anatomii szacować odległość ewolucyjną
między człowiekiem a bakterią Escherichia
coli , ich budowa jest bowiem zbyt odmienna
i trudno wskazać jakiekolwiek porównywal-
ne cechy. Mają one jednak wiele podobnych
genów, np. loci, w których są zapisane se-
kwencje rybosomalnego DNA. Dzięki takim
genom możliwe jest stworzenie kompletnego
drzewa życia.
Dla odtwarzania filogenezy nie bez zna-
czenia jest sposób, w jaki utrwaliły się anali-
zowane zmiany cech (mutacje). Procesy pro-
wadzące do rozpowszechnienia się mutacji
możemy podzielić na dwa rodzaje: determi-
nistyczne oraz stochastyczne (losowe). Proce-
sem deterministycznym jest dobór naturalny
— mutacje korzystne zwiększają swój udział
w puli genowej, natomiast niekorzystne są z
niej eliminowane (patrz rozdział Ł oMnicKiE -
Rekonstrukcja filogenezy
487
Go Dobór naturalny w tym zeszycie KOSMO-
SU). Dobór naturalny jest architektem ewolu-
cji, odpowiedzialnym za różnorodność orga-
nizmów. Paradoksalnie jednak, cechy utrwa-
lone wskutek działania doboru mogą być
zawodne w odtwarzaniu przebiegu ewolucji,
silny nacisk selekcyjny sprzyja bowiem zmia-
nom homoplastycznym — konwergencjom. W
filogenetyce bardziej przydatne są cechy, któ-
re utrwaliły się przypadkowo, jest bowiem
mało prawdopodobne, że taka sama przypad-
kowa zmiana utrwali się ponowne. Gdzie ta-
kich cech szukać? Fenotyp organizmu podle-
ga silnej presji środowiska, a zatem zdecydo-
wana większość cech fenotypowych musiała
przejść przez sito doboru. Inaczej jest na po-
ziomie genetycznym. Kiedy poznano sekwen-
cje genów, zauważono dużą liczbę mutacji
milczących, czyli niezmieniających sekwencji
kodowanego białka; jeszcze więcej mutacji
stwierdzono w sekwencjach niekodujących,
np. w przestrzeniach międzygenowych albo
w intronach. Spostrzeżenia te zaowocowały
sformułowaniem neutralnej teorii ewolucji,
której autorem był japoński badacz Motoo
Kimura (patrz też artykuł Ł oMnicKiEGo Dryf
genetyczny w tym zeszycie KOSMOSU). Za-
kłada ona, że większość substytucji (mutacji
punktowych) jest neutralna lub prawie neu-
tralna dla organizmu oraz że ich utrwalenie
w populacji jest procesem przypadkowym.
Ponieważ procesy powstawania i utrwalania
mutacji są stochastyczne, to różnice między
sekwencjami tego samego odcinka DNA u
różnych organizmów są funkcją czasu, jaki
upłynął od rozejścia się prowadzących do
nich linii filogenetycznych. Umożliwia to nie
tylko samo oszacowanie filogenezy, ale także
— przy spełnieniu dodatkowych warunków
— na opisanie tej filogenezy za pomocą skali
czasu (patrz artykuł J ErzManowsKiEGo w tym
zeszycie KOSMOSU).
filoGEnEtyKa MolEKUlarna a traDycyJna taKsonoMia
„Inwazja” metod molekularnych do takso-
nomii oraz tradycyjnej filogenetyki bazującej
na cechach morfologicznych nie odbyła się
bez oporów. Wnioski płynące z badań mole-
kularnych były rewolucyjne, obalały bowiem
wiele głęboko zakorzenionych poglądów na
relacje pokrewieństwa między organizmami.
Niekiedy tradycyjnym taksonomom trudno
było się pogodzić z tymi wnioskami, a także z
tym, że badania molekularne w krótkim czasie
dały odpowiedź na pytania, nad którymi oni
biedzili się przez całe życie. Nieufność do wy-
ników badań molekularnych pogłębiały błędne
oznaczenia gatunków w niektórych analizach
(biolodzy molekularni nie zadali sobie trudu
zweryfikowania użytego do badań materiału)
oraz niestabilność kladów (gałęzi drzewa) spo-
wodowana niedostatecznym próbkowaniem
taksonomicznym (liczba taksonów) i genetycz-
nym (reprezentatywność i długość sekwencji).
Ponadto, dało się zauważyć pewną nonszalan-
cję taksonomów molekularnych, połączoną z
naiwną wiarą, że drzewo molekularne jest od-
powiedzią na wszystkie pytania. Wkrótce jed-
nak okazało się, że drzewo molekularne jest
nie tyle końcem, co początkiem badań — trze-
ba bowiem je zinterpretować i sprawdzić, czy
istotnie odpowiada na jakiekolwiek pytania
ewolucyjne. Dziś już oba nurty — molekular-
ny i morfologiczny — zgodnie koegzystują w
taksonomii i biologii ewolucyjnej, korzystając
wzajemnie z uzupełniających się kompetencji.
Do absolutnych wyjątków należy kwestiono-
wanie wyników badań molekularnych, jak to
ostatnio uczynili G rEhan i s chwartz (2009),
postulując na podstawie zaledwie kilkudzie-
sięciu cech morfologicznych, a wbrew bada-
niom molekularnym, że najbliższym krewnym
człowieka jest orangutan, a nie szympans. Ich
krytyka filogenetyki molekularnej jest naiwna
i świadczy o podstawowych brakach w wie-
dzy — odrzucają oni bowiem wyniki analiz
molekularnych twierdząc, że podobieństwo
molekularne nie świadczy o pokrewieństwie,
ustalenie homologii jest wątpliwe, a morfo-
logia jest bardziej stabilna ewolucyjnie. Ab-
solutne zdumienie budzi fakt, że artykuł ten
został opublikowany w bardzo prestiżowym
czasopiśmie, jakim jest Journal of Biogeogra-
phy. Jednak towarzyszący mu komentarz od
redakcji świadczy, że głównym powodem pu-
blikacji była raczej „polityczna poprawność”
— oddanie głosu zanikającej mniejszości — a
sami redaktorzy mają świadomość, iż dla każ-
dego biologa molekularnego albo taksonoma
lub antropologa choćby nieco obeznanego z
filogenetyką molekularną wnioski autorów są
nonsensowne. Filogenetyka molekularna to
jednak coś więcej niż prosta analiza podobień-
stwa molekularnego, co oczywiście nie znaczy,
że wnioskowanie filogenetyczne na podstawie
danych molekularnych jest zawsze bezbłęd-
ne i nieobarczone niepewnością. Warto sobie
uświadomić źródła tej niepewności.
488
K rzysztof s paliK , M arcin p iwczyńsKi
hoMoloGia sEKwEncJi i syGnaŁ filoGEnEtyczny
Porównując te same sekwencje DNA
otrzymane od osobników z różnych popula-
cji lub z różnych gatunków możemy oczeki-
wać, że bliżej spokrewnione będą osobniki
(gatunki), które różnią się mniejszą liczbą
mutacji. Czy zatem wnioskowanie o pokre-
wieństwach między organizmami jest pro-
stym zabiegiem polegającym na porównaniu
sekwencji i obliczeniu liczby różniących je
podstawień? Sytuacja nie jest tak prosta, a
droga do odtworzenia filogenezy jest pełna
pułapek. Po pierwsze, sekwencje wybrane do
analizy powinny być homologiczne, czyli po-
chodzące od wspólnego przodka. Homologia
na poziomie sekwencji ma jednak dwojakie
oblicze. Sekwencje ortologiczne zajmują ten
sam locus i ewoluują niezależnie od czasu
rozejścia się linii filogenetycznych, czyli od
specjacji. To one niosą sygnał filogenetyczny
— zapis historii ewolucyjnej danej linii ewo-
lucyjnej. W trakcie ewolucji regularnie wy-
stępują jednak także duplikacje loci (patrz
artykuł J ErzManowsKiEGo w tym zeszycie KO-
SMOSU), w wyniku czego powstają sekwen-
cje paralogiczne. Pomieszanie sekwencji or-
tologicznych i paralogicznych uniemożliwia
odtworzenie prawidłowej filogenezy, ponie-
waż sekwencje paralogiczne ewoluują nieza-
leżnie od momentu duplikacji locus, a nie od
rozejścia się linii filogenetycznych.
Wybór sekwencji ortologicznych nie gwa-
rantuje jednak, że informacja o ich historii
ewolucyjnej jest niezaburzona. Procesami,
które powodują, że sekwencje są do siebie
bardziej podobne, niżby to wynikało z czasu,
który upłynął od ich rozejścia się, są:
— mutacje wsteczne (rewersje), czyli po-
wrót do nukleotydu występującego w se-
kwencji u wspólnego przodka;
— wielokrotne podstawienia, czyli kilku-
krotne zamiany nukleotydów w tym samym
miejscu, wskutek czego obserwujemy mniej
podstawień, niż ich w rzeczywistości było;
— podstawienia równoległe, czyli nieza-
leżne podstawienia w tej samej pozycji przez
ten sam nukleotyd w obu porównywanych
sekwencjach.
Wszystkie te procesy zaburzają liniową
zależność między czasem rozejścia się organi-
zmów a liczbą obserwowanych mutacji oraz
zacierają sygnał filogenetyczny, czyli mutacje
synapomorficzne, dzięki którym można zi-
dentyfikować pokrewieństwo gatunków.
Bardzo istotnym problemem jest także
zidentyfikowanie homologicznych pozycji w
sekwencji, czyli dokonanie ich przyrównania.
Nie zawsze jest to zadanie łatwe, ponieważ
w trakcie ewolucji zachodzą nie tylko pod-
stawienia nukleotydów, ale także ich insercje
(wstawienia) i delecje (usunięcia). W wy-
padku sekwencji kodujących białka insercje
i delecje są zazwyczaj usuwane przez dobór
oczyszczający, albowiem wstawienie bądź
usunięcie jednego lub dwóch nukleotydów
zmienia odczyt, wskutek czego białko prze-
staje być funkcjonalne. Jedynie wstawienia
trzech (albo wielokrotności trzech) nukle-
otydów mają szansę na przejście przez sito
doboru. Natomiast w sekwencjach niekodu-
jących, np. w intronach lub przestrzeniach
międzygenowych, delecje i insercje zdarzają
się często. Proces przyrównywania sekwen-
cji jest kluczowy do właściwego oszacowania
pokrewieństw między organizmami żywymi
i obecnie istnieje wiele algorytmów umożli-
wiających dokonanie takiego przyrównania.
UKorzEnianiE DrzEwa
Przyjrzyjmy się strukturze drzewa filoge-
netycznego jako zapisowi relacji pokrewień-
stwa ewolucyjnego między organizmami.
Drzewo to zbudowane jest z węzłów — ze-
wnętrznych i wewnętrznych — i łączących je
gałęzi (Ryc. 1). W drzewie w pełni rozwiąza-
nym każdy węzeł wewnętrzny połączony jest
z innymi węzłami za pomocą trzech gałęzi,
zaś do węzłów zewnętrznych prowadzi tylko
jedna. W drzewie nie w pełni rozwiązanym
gałęzi wychodzących z jednego węzła może
być więcej, czyli występują politomie. Węzły
zewnętrzne nazywamy inaczej liśćmi; każdy z
nich odpowiada badanemu organizmowi. Na-
tomiast węzły wewnętrzne można przypisać
hipotetycznym wspólnym przodkom okre-
ślonych konarów (kladów) drzewa. Drzewo
zrekonstruowane metodami filogenetyczny-
mi jest zazwyczaj drzewem niezakorzenio-
nym, a więc takim, w którym nieznany jest
kierunek ewolucji. Innymi słowy, nie wiemy,
która z tych trzech gałęzi wchodzi do dane-
Rekonstrukcja filogenezy
489
Rycina 1. Struktura drzewa niezakorzenionego
(1) i zakorzenionego (2).
Oba drzewa mają tę samą topologię. A, B, C, D ozna-
czają liście, czyli węzły zewnętrzne drzewa, zaś E, F
i G — węzły wewnętrzne, przy czym drzewo (2) jest
ukorzenione w węźle G. Strzałki przy drzewie za-
korzenionym wskazują kierunek ewolucji, w przeci-
wieństwie do drzewa niezakorzenionego, w którym
kierunek ten jest nieznany.
go węzła, a które z niego wychodzą (Ryc. 1).
Ukorzenienie polega na dodaniu dodatko-
wego węzła na jednej z gałęzi, tożsamego ze
wspólnym przodkiem wszystkich badanych
organizmów. Innymi słowy, łamiemy tę ga-
łąź na dwie oraz do miejsca złamania (węzła)
dołączamy korzeń drzewa. Po ukorzenieniu
drzewa możemy zauważyć, że zmienia się
status gałęzi w węzłach. W drzewie niezako-
rzenionym wszystkie trzy gałęzie zbiegające
się w węźle wewnętrznym są równocenne,
natomiast w drzewie zakorzenionym jedna z
nich jest gałęzią wchodzącą, a dwie wycho-
dzącymi. Grupy wywodzące się z jednego
węzła nazywamy siostrzanymi. Warto zauwa-
żyć, że bez ukorzenienia drzewa nie możemy
wyciągać żadnych sensownych wniosków o
ewolucji badanej grupy, np. o monofilety-
zmie określonych taksonów albo o kierunku
zmian morfologicznych.
Najlepszym sposobem ukorzenienia drze-
wa jest uwzględnienie w analizie filogene-
tycznej nie tylko badanej grupy, ale także jej
najbliższych krewnych, czyli tzw. grupy ze-
wnętrznej. Odszukujemy na uzyskanym drze-
wie wspólny wewnętrzny węzeł dla badanej
grupy i wspólny wewnętrzny węzeł dla gru-
py zewnętrznej, a następnie przełamujemy łą-
czącą je gałąź. Przykładowo, wiemy z innych
badań, że grupą siostrzaną roślin okrytoza-
lążkowych są nagozalążkowe. Rekonstruując
filogenezę okrytozalążkowych, wybieramy
więc sekwencje jednego lub kilku nagoza-
lążkowych, np. sosny, sagowca, miłorzębu
lub welwiczji, jako przedstawicieli grupy ze-
wnętrznej. Następnie na drzewie odszuku-
jemy gałąź łączącą okryto- i nagozalążkowe
i przełamujemy ją, dodając korzeń. Dzięki
takiemu zabiegowi jesteśmy w stanie stwier-
dzić, w jakiej kolejności oddzielały się po-
szczególne linie rodowe okrytozalążkowych
i która grupa współczesnych gatunków jest
filogenetycznie najstarsza. Ukorzenianie drze-
wa za pomocą grupy zewnętrznej jest stan-
dardową procedurą w badaniach filogene-
tycznych. Warto jednak zauważyć, że błędne
wybranie grupy zewnętrznej, a tym samym
błędne zakorzenienie, sprawia, że błędnie
odczytujemy na nim kierunek ewolucji.
Wszystkie metody szacowania filogene-
zy dają możliwość obliczenia długości gałęzi
łączących poszczególne węzły. Jeśli długość
gałęzi jest proporcjonalna do liczby mutacji
(obserwowanej lub oszacowanej), które za-
szły między węzłami, to takie drzewo nazy-
wamy filogramem. Natomiast jeśli długość
gałęzi odpowiada czasowi względnemu lub
absolutnemu, wtedy mówimy o chronogra-
mie. Czasami interesuje nas tylko topologia
drzewa (wzór rozgałęzień), a długość gałęzi
jest nieistotna — takie drzewo nazywamy kla-
dogramem.
DrzEwo GatUnKÓw i DrzEwo GEnÓw
Warto zwrócić uwagę, że drzewo filoge-
netyczne odzwierciedla relację między przy-
równanymi sekwencjami, dlatego też jest ono
zawsze drzewem genów. Nie zawsze historia
ewolucyjna genów odpowiada historii gatun-
ków. Mechanizmów prowadzących do takich
niezgodności jest kilka. Najważniejsze to:
— rekombinacja genów paralogicznych
lub rekrutacja pseudogenów, wskutek czego
powstały rekombinowany allel zawiera sygnał
filogenetyczny z dwóch lub więcej loci;
— horyzontalny przepływ genów, czyli
„przeskoczenie” materiału genetycznego z
jednej linii filogenetycznej do drugiej; zjawi-
sko to jest powszechne u bakterii, ale sto-
sunkowo rzadkie wśród eukariotów, choć u
roślin kwiatowych, szczególnie w genomie
mitochondrialnym, znaleziono geny pocho-
192621719.002.png
Zgłoś jeśli naruszono regulamin