Családfakutatás: a környezet hatásai
Az eddig publikált legnagyobb validált családfa 13 millió embert köt össze az elmúlt 5 évszázadból.
A Science-ben publikált egyetlen összefüggő családfa adatai szerint génjeink csak 16%-ban határozzák meg élettartamunkat; az eddig érvényesnek vélt becslés – 25% - skandináviai ikerkísérletekből származott. Joanna Kaplanis és munkatársai tanulmánya (Quantitative analysis of population-scale family trees with millions of relatives) arra hívja fel a figyelmet, hogy a környezetnek és a viselkedésnek nagyobb szerepe van egészségünkben, illetve élettartamunkban, mint eddig gondoltuk.
A Kaplanis és munkatársai által publikált családfa a legnagyobb validált családfa, amit eddig készítettek, genealógiai adatbázisa 5 évszázadra nyúlik vissza, és 13 millió embert köt össze, akik vagy vérrokonok vagy házastársak. A családfa alapján a gének és az élettartam százalékos összefüggésén kívül is számos érdekes információra derült fény, és a kutatók szerint a továbbiakban az egyes betegségek genetikai hátterének tisztázására is használható.
A vizsgálatot vezető genetikus, Yaniv Erlich (Columbia University) hét éve kezdett dolgozni a validált családfa felépítésén, amikor egy távoli rokona megismertette egy crowdsourcing website működésével: a Geni.com nevű honlapon az emberek megoszthatják családfájukat. Erlich engedélyt kapott a honlap több tízmillió publikus profilja adatainak (a személy neve, neme, születésének dátuma és helye, halálának dátuma, közvetlen rokonai) letöltéséhez és felhasználásához, majd munkatársaival 3 év alatt kidolgozták, hogyan lehet ezeket az adatokat értelmezni, a személyek közötti kapcsolatokat ellenőrizni, a hibákat kijavítani, majd további adatok felhasználásával (pl. 80.000 vermonti iskolai végzettséget is tartalmazó halotti anyakönyvi kivonata és jelentős ausztrál adatbázisok) eljutottak odáig, hogy kiindulásképpen 86 millió profillal rendelkeztek. (Mivel a 80.000 vermonti halottból ezer a Geni.com adatbázisában is szerepelt, a kutatók meg tudták állapítani, hogy a családfakutatás ugyanúgy érdekli az alacsonyabb iskolai végzettségűeket, mint az iskolázottabbakat.)
A 86 millió profil validálása után Erlich és munkatársai populációs méretű családfákhoz jutottak, köztük egy olyan összefüggő családfához, amely 13 millió, túlnyomó részt európai eredetű személy rokonsági viszonyait ábrázolja, 11 generációra visszamenően. A származási országok között valamennyi nyugati ország szerepel, vagyis a családfa által kiválóan nyomon követhető az Amerikába történő újkori migráció. (A Geni-nek azóta már 120 millió összekapcsolt profilja van, azonban ezek nem mind validáltak.)
A halálozási adatok áttekintése alapján a kutatók azt találták, hogy az élettartam-fluktuáció ezalatt a 11 generáció alatt az elvártnak megfelelően alakult: a polgárháború és a két világháború alatt sok férfi halt meg fiatalon, a csecsemőhalandóság az 1900-as években jelentős csökkenésnek indult. A születések helyének térképre helyezésével ábrázolni lehetett a fő migrációs eseményeket, pl. a Mayflower 1620-as megérkezését követően igen megugrott a születések száma a jelenlegi Massachusetts-ben, ahogy megnőtt a születésszám 1788 után Ausztráliában is (ekkor alapították ott az első brit fegyenc-kolóniát).
A validált családfákból többek között kiderül, hogy 1700 körül Amerikában az emberek tipikusan tíz kilométeren belül lakó, negyedik unokatestvérükkel házasodtak össze, majd 1850 körül megváltozott a mintázat, és ekkortól a házasulók távolabbi rokoni körből kerültek ki. A változást nem magyarázza a házasulók születési helye közötti földrajzi távolság növekedése, írják a kutatók, vagyis ezidőtájt erősödhettek meg azok a kulturális tabuk, amik tiltják az unokatestvérek közötti házasságot.
Erlich tavaly a Geni.com-ot is birtokló MyHeritage.com tudományos főmunkatársa lett, és a Columbia genetikusai elkezdték a validált családfa-adatokat olyan honlap (DNA.Land) adataival összeolvasztani, amelyen az önkéntesek saját kereskedelmi DNS-tesztelő szolgáltatóktól (pl. 23andMe és MyHeritage.com) származó genotipizálási adataikat (köztük mitokondriális DNS és Y-kromoszóma DNS adatok) és egészségfelmérő kérdőívekre adott válaszaikat osztják meg. Az összeolvasztott adatok (kivéve a személynevek) más kutatók számára is elérhetők (FamiLinx.org).
Mint Erlich a Science kutatásról beszámoló hírportáljának elmondta (Jocelyn Kaiser: Thirteen million degrees of Kevin Bacon: World’s largest family tree shines light on life span, who marries whom), a több millió élő és halott ember családi kapcsolatait validált módon tartalmazó összefüggő családfa és a több tízezer élő személy genetikai adatát összekapcsoló adatbázis révén lehetőség nyílik a betegségek és a tulajdonságok (pl. testmagasság) genetikai hátterének tisztázására, és az öröklődés-vagy-környezet kérdés pontosabb megválaszolására. (Hasonló, azonban nagyságrendileg jóval kisebb lehetőséget biztosít az izlandi deCODE Genetics is az ország extenzív genealógiai adatbázisa és a 300.000 szigetlakó DNS- és egészségi adatainak kombinálása révén.) A vizsgálat arra is felhívja a figyelmet, hogy genealógusok milliói működhetnek együtt, és hozhatnak létre jó minőségű, populációs méretű családfákat, mondja Erlich.