Istraživači stvaraju najveće ljudsko obiteljsko stablo ikada
Istraživači s Big Data Instituta Sveučilišta u Oxfordu napravili su veliki korak prema mapiranju cjelokupnih genetskih odnosa među ljudima: jedinstvene genealogije koja prati podrijetlo svih nas. Studija je objavljena u časopisu Science.
Posljednja dva desetljeća bilježe izniman napredak u istraživanju ljudskih genetika, generirajući genomske podatke za stotine tisuća pojedinaca, uključujući tisuće pretpovijesnih ljudi. To otvara uzbudljivu mogućnost praćenja podrijetla ljudske genetske raznolikosti kako bi se proizvela potpuna karta kako su pojedinci diljem svijeta međusobno povezani.
Do sada su glavni izazovi za ovu viziju bili izrada načina za kombiniranje sekvenci genoma iz mnogih različitih baza podataka i razvoj algoritama za obradu podataka ove veličine. Međutim, nova metoda koju su objavili istraživači s Big Data Instituta Sveučilišta u Oxfordu može lako kombinirati podatke iz više izvora i mjeriti kako bi se prilagodili milijunima sekvenci genoma.
Dr. Yan Wong, evolucijski genetičar s Big Data Instituta i jedan od glavnih autora, objasnio je: "U osnovi smo izgradili veliko obiteljsko stablo, genealogiju za cijelo čovječanstvo koja modelira koliko god možemo povijest koja je stvorila sve genetske varijacije koje danas nalazimo kod ljudi. Ova genealogija nam omogućuje da vidimo kako je genetski slijed svake osobe povezan sa svakom drugom, duž svih točaka genoma."
Budući da su pojedinačne genomske regije naslijeđene samo od jednog roditelja, bilo majke ili oca, podrijetlo svake točke na genomu može se smatrati stablom. Skup stabala, poznat kao "slijed stabala" ili "graf rekombinacije predaka", povezuje genetske regije unatrag kroz vrijeme s precima gdje se genetska varijacija prvi put pojavila.
Glavni autor dr. Anthony Wilder Wohns, koji je poduzeo istraživanje u sklopu svog doktorata na Big Data Institutu i sada je postdoktorski istraživač na Institutu MIT-a i Harvarda, rekao je: "Mi rekonstruiramo genome naših predaka i koristimo ih za formiranje goleme mreže odnosa. Tada možemo procijeniti kada i gdje su ti preci živjeli. Snaga našeg pristupa je u tome što daje vrlo malo pretpostavki o temeljnim podacima i može uključivati i moderne i drevne uzorke DNK."
Studija je integrirala podatke o modernim i drevnim ljudskim genomima iz osam različitih baza podataka i uključila je ukupno 3.609 pojedinačnih sekvenci genoma iz 215 populacija. Drevni genomi uključivali su uzorke pronađene diljem svijeta s dobi u rasponu od 1000 do preko 100.000 godina. Algoritmi su predvidjeli gdje zajednički preci moraju biti prisutni u evolucijskim stablima kako bi se objasnili obrasci genetske varijacije. Rezultirajuća mreža sadržavala je gotovo 27 milijuna predaka.
Nakon dodavanja podataka o lokaciji na tim uzorcima genoma, autori su upotrijebili mrežu kako bi procijenili gdje su živjeli predviđeni zajednički preci. Rezultati su uspješno ponovno uhvatili ključne događaje u povijesti ljudske evolucije, uključujući migraciju iz Afrike.
Iako je genealoška karta već iznimno bogat resurs, istraživački tim planira je učiniti još sveobuhvatnijom tako što će nastaviti uključivati genetske podatke kako postanu dostupni. Budući da sekvence stabala pohranjuju podatke na vrlo učinkovit način, skup podataka bi lako mogao smjestiti milijune dodatnih genoma.
Dr. Wong je rekao: "Ova studija postavlja temelje za sljedeću generaciju sekvenciranja DNK. Kako se kvaliteta sekvenci genoma iz modernih i drevnih uzoraka DNK poboljšava, stabla će postati još točnija i na kraju ćemo moći generirati jedinstvena, ujedinjena karta koja objašnjava porijeklo svih ljudskih genetskih varijacija koje danas vidimo."
Dr. Wohns je dodao: "Dok su ljudi u fokusu ove studije, metoda je važeća za većinu živih bića; od orangutana do bakterija. Mogla bi biti osobito korisna u medicinskoj genetici, u odvajanju stvarnih veza između genetskih regija i bolesti od lažnih veze koje proizlaze iz naše zajedničke povijesti predaka."
Izvor: Science