Geny przodków. Przodkowie zapisani w genach

Dlaczego kuzyn i pradziadek to takie samo pokrewieństwo?

Popularność komercyjnych badań genetycznych rośnie także w Polsce, w szczególności wśród osób zajmujących się genealogią. Co sprawia, że ludzie chcą sprawdzić co mają „zapisanego” w genach? Czy ta ciekawość rośnie proporcjonalnie do tajemnic – nieznany przodek, nieślubne dzieci, czy po prostu nieznane pochodzenie? Potomkowie emigrantów zapewne zadają sobie wiele takich i podobnych pytań. Bardzo popularne stają się portale na którym można publikować swoje drzewo genealogiczne (Ancestry, My Heritage). Dochodzą do tego także portale, na których oprócz drzewa genealogicznego można zamówić test DNA, dzięki czemu nasze wyniki są porównywane z innymi użytkownikami (23 and Me, FTDNA, Living DNA, Genesis GedMatch). Na tych portalach chyba najwięcej kont należy do osób, których przodkowie wyemigrowali za Wielką Wodę na przełomie XIX i XX wieku.

Genealogia a genetyka

Czy wynik takiego testu da odpowiedź – w ilu procentach jestem Polakiem, Węgrem czy Żydem? Czy badania genetyczne zastąpią tradycyjną genealogię? Czy  wzajemnie się uzupełniają się? Genealogia to zarówno poszukiwanie przodków jak i dalekich krewnych. Chyba każdy kto choć raz próbował narysować swoje drzewo genealogiczne zadał sobie pytanie – a kto był wcześniej? Odpowiednio rozbudzona ciekawość otwiera drzwi to niekończącej się przygody. Genealogia tradycyjna wydaje się mieć granice tam, gdzie kończą źródła pisane. Nawet jeśli zachowały się jakieś dokumenty z XVI wieku to możemy stanąć oko w oko z 15 Bartkami w jednej wsi. No i skąd mamy wiedzieć, kto jest kto? Nazwiska dopiero się tworzyły, a jeśli ktoś już był znany jako Bartek z Krakowa to jak mógł się nazywać jego syn albo ojciec? Jan z Kleparza, Marcin z Krakowa, Wojtek ze Młyna?  Jak natomiast wyglądają granice badań genetycznych? Każdy człowiek ma 23 pary chromosomówa na każdym z nich zapisane tysiące danych na temat nas samych. Zasada dziedziczenia jest prosta. Rodzice przekazują mniej więcej po połowie materiału genetycznego swojemu dziecku. Ot, naturalny proces sterujący ewolucją. Od czasu do czasu pojawi się jakaś mutacja, a więc zmiana w sekwencji DNA. Dzięki temu każdy z nas jest inny, ale także i trochę podobny. Test autosomalny polega właśnie na szukaniu takich podobieństw w sekwencji DNA. Tutaj pojawia się pierwsza granica genetyki. Jeśli nasz „kuzyn” nie zrobił sobie testu, to nie mamy się z kim porównać. W tradycji chrześcijańskiej wszyscy ludzie wywodzą się od biblijnego Adama, więc poniekąd każdy z nas coś dostał od Adama. Jakże to banalnie brzmi. Skoro twierdzimy, że wszyscy mamy wspólnego przodka to jaki cel ma genealogia?  I tutaj chyba dochodzimy chyba do sedna sprawy – pytamy nie tylko o pochodzenie, ale i stopień pokrewieństwa. Chcemy umieć to policzyć. 1 – ja, 2 – rodzice, 3 – dziadkowie, 4- pradziadkowie, 5- prapradziadkowie itd. Apetyt rośnie w miarę jedzenia. Czy nie byłoby to fenomenalne, aby móc policzyć na przykład do 11? 11 pokoleń wstecz to czasy sięgające przodków, którzy żyli w XVIII a nawet XVII wieku. 

Alfabet DNA

Genetyka posługuje się alfabetem składającym się z 4 „liter” – A T G C. Są to pierwsze litery nazw zasad azotowych, które tworzą sekwencję DNA np. AAAGCTTA. A – adenina, T – tymina, G – guanina, C- cytozyna. Sekwencje DNA przechowują informację o strukturze białek budujących nasz organizm, które są przekazywane dziedzicznie. I to jest właśnie kluczowa informacja – przekazywane dziedzicznie. Trudno z tych symboli wyczytać imię przodka, chociaż pewnie niedługo będzie można ustalić jego wygląd. Tylko którego dokładnie przodka? Ojca, matki, ojczystego dziadka, ojczystej babki, matczynego dziadka, matczynej babci? Pradziadków mamy 8, Prapradziadków 16, pra pra pra… 32, pra… 64, 128, 256, 512, 1024. Możemy naliczyć ponad tysiąc przodków już 10 pokoleń wstecz. Pytanie, który przodek, 1 z 1000, przekazał nam dokładnie ten jeden fragment, który zachował się w naszym chromosomie. W moim przypadku bardzo dziękuje temu przodkowi, który przekazał mi pieprzyk na palcu prawej ręki. Dzięki temu nie miałem problemu w podstawówce, aby rozróżnić prawą od lewej ręki.

Test Autosomalny

Jak więc możemy w choć małym stopniu przybliżyć się odpowiedzi „Kto jest kim w łańcuchu DNA”? Najprościej byłoby przetestować babcie albo dziadka i sprawdzić czy w danym fragmencie DNA mamy zapisaną taką samą informacje. Hola! Ale jak zbadać przodka, który żył 200 lat temu? Teoretycznie się da, jeśli wiemy, gdzie spoczywają jego ludzkie szczątki. I tutaj pojawia się kolejny problem. Ja nie wiem, gdzie jest pochowana moja prababcia, która zmarła w 1942 roku. Skoro więc nie możemy tego sprawdzić bezpośrednio to jak? Potrzebni są nam nasi kuzynowie (genetyczni oczywiście). Test Autosomalny polega na porównaniu sekwencji „ATGC”. Jeśli istnienie taka sama kolejność występowania tych samych „literek” to istnienie spore prawdopodobieństwo, że algorytm poda wynik pozytywny – jest podobieństwo. Surowe dane wyglądają mniej więcej tak:
zdjęcie 1. Surowe dane uzyskane podczas analizy DNA

Na rysunku powyżej widzimy fragmencik wyników, które zostały rozczytane w procesie analizy DNA. Na pierwszy rzut oka widać, że oba fragmenty są różne. Jednak, jeśli weźmiemy pod uwagę fakt, że aby mówić o podobieństwie wystarczy przynajmniej jedno dopasowanie w danym miejscu u dwóch osób, to okazuje się, że te wyniki mogą należeć do krewnych, którzy odziedziczyli ten sam fragment po wspólnym przodku. Na zielono zaznaczono podobieństwa:

zdjęcie 2. Porównanie danych dwóch kuzynów
Tak w wielkim skrócie i uproszczeniu działa algorytm porównawczy testu autosomalnego. Teraz weźmy pod uwagę, że najmniejszy ludzki chromosom ma ok. 47 milionów takich par, a największy ok 250 milionów… a chromosomów jest 23. Potrzebny jest naprawdę dobry komputer, aby to wszystko porównać w miarę rozsądnym czasie.

Wspólne segmenty DNA i centymorgany

Teraz kilka słów, aby jeszcze bardziej to skomplikować. Chromosom składa się nie z pojedynczych segmentów literek ATGC, ale z ich par (jak na wcześniejszym rysunku). Oznacza to, że każda para posiada podwójną informację: jedna „literka” pochodzi od ojca, a druga od matki. Problem w tym, że aktualnie nie jesteśmy w stanie powiedzieć, który jest który. Dlatego też algorytm wskazuje podobieństwo, jeśli przynajmniej jedna z „literek” się zgadza. Jeśli więc wrócimy to naszego przykładu, to możemy sobie przesortować wyniki tak, aby w górnej „linijce” były te „literki”, które powtarzają u obu osób. Jeśli faktycznie są one kuzynami, to ten fragment jest odziedziczony od wspólnego przodka.
zdjęcie 3. Wspólny segment zaznaczony na niebiesko
Z genetycznego punktu widzenia jesteśmy tak samo spokrewnieni ze swoim rodzicem jak i swoim dzieckiem, ze swoim wujkiem, jak i swoim bratankiem. Dlaczego? Bo mamy średnio tylko samo wspólnych fragmentów DNA. Warto więc nauczyć się nowego sposobu liczenia pokrewieństwa, tuż obok tych wynikających z prawa cywilnego oraz prawa kościelnego. Zamiast IV stopień pokrewieństwa możemy powiedzieć 123,4 centymorganów. Centymorgan (cM) to jednostka miary, którą stosuje się do określania odległości między obszarami zajmowanymi przez gen. Im dłuższy segment i im więcej obszarów jest podobnych (tzn. przynajmniej jedna literka się zgadza) tym więcej mamy wspólnych centymorganów. Z rodzicami jest to ok. 3500 cM (50%), z dziadkami ok. 1750 cM (25%) itd.  W przypadku krewnych w linii bocznej – rodzeństwa, kuzynostwa – ilość cM może się znacznie różnić. Skoro mieli tych samych przodków, to mogli oni odziedziczyć te same, jak i inne fragmenty DNA. Na tym właśnie polega cała zabawa, aby odszukać tych wspólnych przodków we wspólnych fragmentach. Jeśli nie znamy stopnia pokrewieństwa z naszym genetycznym kuzynem, to właśnie porównanie naszych przodków może dać odpowiedź, jeśli znajdziemy tych wspólnym. Tym wspólnym przodkiem może być nawet ktoś kto żył nawet XVIII wieku. Warto pamiętać też o tym, że każdy dziedziczy inny zestaw genów, więc brat i siostra mogą odziedziczyć inne geny od przodków żyjących w XVIII wieku. Tak więc, im więcej jesteśmy wstanie zidentyfikować bliższych pokrewieństw, tym mamy większą szansę na odkrycie dużo dalszych kuzynów, których korzenie sięgają dużo dalej niż niektóre księgi metrykalne.

Niebieski Dziadek

Nie ma nic lepszego niż obraz czy schemat, więc jeśli dotychczasowy opis nie jest wystarczający by zrozumieć podstawy i samemu zacząć bawić się z genealogią genetyczną, to przedstawię to jeszcze bardziej obrazowo. Mam nadzieje, że specjaliści w tej dziedzinie nie oskarżą mnie o zbytnie upraszczanie. Jednak jako fizyk z wykształcania lubię najtrudniejsze zawiłości praw nauki przedstawiać w jak najbardziej obrazowy sposób. Porównajmy ze sobą dwójkę rodzeństwa oraz ich wspólnego „niebieskiego” dziadka. Pomińmy całą kwestią analizy, od razu przejdźmy do wyników. W pewnym stopniu algorytmy robią to automatycznie, więc cała praca analizy DNA jest dużo prostsza. Warto jednak wiedzieć, jak to wygląda od środka. Skorzystaliśmy z narzędzia DNA Painter i ustaliliśmy fragmenty, które odziedziczone zostały po wszystkich dziadkach. Dla uproszczenia każdy fragment został pokolorowany na inny kolor.
zdjęcie 4. Porównanie chromosomów „niebieskiego dziadka” oraz jego dwóch wnuków

Na pierwszy rzut oka widzimy, że rodzeństwo (roboczo nazwane dziecko 1 i dziecko 2) są bardzo podobni genetycznie – tacy mocno „niebiescy”. Z drugiej strony widzimy, że rodzeństwo jednak się różni, pomimo tego, że mają tych samych rodziców, tych samych dziadków (w tym tego „niebieskiego”), tych samych pradziadków i tak dalej. Odpowiedzią jest rekombinacja. Dlaczego i co znaczy? Tak zostały nazwane procesy biologiczne sterujące dziedziczeniem. Nas jako genealogów genetycznych interesuje fakt, że pomimo tych różnic, możemy coś porównać. Po analizie okazało się, że materiał genetyczny od dziadków rekombinował w taki sposób:

zdjęcie 5. Schemat pokazujący dziedziczenie materiału genetycznego na przykładzie „kolorowych” chromosomów”

Ładnie, kolorowo i schematycznie, ale o co chodzi? Przeanalizujmy to krok po kroku. Zacznij, więc od „niebieskiego” dziadka. W procesie rekombinacji (wymiana materiały genetycznego) może dojść do crossingover. Najprościej można powiedzieć, że jest to wymiana odcinków łańcucha DNA. Na rysunku poniżej zaznaczono czerwoną linią miejsce rozczepienia genów. Część informacji znika bezpowrotnie, a dokładnie połowa. Po jednej stronie zostanie fragment „niebieski”, a po drugiej „lekko-niebieski” (innymi słowy, „literki” z górnej „linijki” po jednej stronie, a „literki” z dolnej „linijki” po drugiej stronie).

Zdjęcie 6. Crossing-over „niebieskiego” dziadka

Tak powstały „pół-chromosom” jest przekazany synowi, a drugą połowę otrzymuje od „zielonej babci”.

zdjęcie 7. Schemat dziedziczenia materiału genetycznego

Kuzyni a przodkowie

Syn „niebieskiego” dziadka i „zielonej” babci odzieczył połowę literek „niebieskich” i połowę literek „zielonych” i tak to się mniej więcej dzieje z pokolenia na pokolenie. Im wcześniej zaczniemy analizę (np. od pradziadków), tym bardziej „kolorowe” fragmenty DNA możemy rozrysować. W tym przypadku poszliśmy na łatwiznę i zaczęliśmy analizę od przodków do potomków. Jak już wcześniej wspomniałem genealogia genetyczna zajmuje się porównywaniem materiału genetycznego kuzynów. To na postawie naszych kuzynów jestesmy wstanie wskazać, który fragment DNA jest oddziedziczony od naszego wspólnego przodka. Algorytm oszukiwania podobieństw może na dostarczać cotygodniowe kolejne osoby, które w jakiś sposób mogą być spokrewnione. Im więcej kuzynów uda nam się zidentyfikować, tym bardziej prezycyjnie jesteśmy w stanie otworzyć te fragmenty i przypisać je do konkrentych przodków. Jeśli już ustalimy, że „niebieski” dziadek to Jan Nowak, to możemy pokusić się o podzielenie tych „niebieskich” fragmentów na jeszcze mniejsze i przypisać je jego rodzicom (naszym pradziadkom), jego dziadkom (naszym prapradziadkom) itd.  Wynik testu autosomalnego zapisany jest jako sekwencja „literek” A, T, G, C, która daje nam możliwość odszukania kuzynów. Jeśli jednak mamy dobrze rozbudowaną genealogię sięgającą XVIII wieku, możemy także „zobaczyć” swoich przodków. Jeśli więc połączymy genealogię i genetykę możemy powiedzieć, że dzięki kuzynom poznajemy swoich przodków.