Yan Wong, jeden z głównych autorów pracy, wyjaśnia, ze wraz ze współpracownikami stworzył on drzewo genealogiczne, które z olbrzymią dokładnością modeluje historię, jaka doprowadziła do powstania wszystkich obserwowanych obecnie u ludzi zmienności genetycznych. Dzięki temu naukowcy mogą przekonać się, w jaki sposób sekwencja genetyczna każdej osoby jest powiązana z sekwencjami innych, biorąc pod uwagę wszystkie elementy genomu.
Czytaj też: Sztuczna inteligencja jest lepszym nauczycielem niż człowiek
W zasadzie rekonstruujemy genomy naszych przodków i wykorzystujemy je do stworzenia rozległej sieci powiązań. Następnie możemy oszacować, kiedy i gdzie żyli ci przodkowie. Siła naszego podejścia polega na tym, że przyjmuje ono bardzo niewiele założeń dotyczących danych bazowych i może obejmować zarówno współczesne, jak i starożytne próbki DNA.dodaje Anthony Wilder Wohns z Big Data Institute
Nowe drzewo genealogiczne obejmuje niemal 27 milionów przodków
Łącznie badanie zawiera dane dotyczące ludzkich genomów pochodzących z ośmiu różnych baz danych. Uwzględniono w nim 3609 indywidualnych sekwencji genomowych z 215 populacji. Starsze genomy obejmowały próbki znalezione na całym świecie, których wiek wahał się od 1000 do ponad 100 000 lat. Dzięki algorytmom naukowcy dowiedzieli się, na których “gałęziach” drzew ewolucyjnych muszą być obecni wspólni przodkowie, aby dało się wyjaśnić zaobserwowane wzorce zmienności genetycznej. Efekt końcowy okazał się naprawdę imponujący: sieć liczy niemal 27 milionów przodków.
Czytaj też: Sztuczna inteligencja jest lepszym nauczycielem niż człowiek
Dodając do niej dane dotyczące lokalizacji tych genomów autorzy badań wykorzystali uzyskaną sieć do oszacowania, gdzie żyli hipotetyczni wspólni przodkowie. Na tej podstawie byli w stanie odtworzyć kluczowe wydarzenia w historii ewolucji człowieka, wliczając w to jego migrację z Afryki. Na tym naukowcy nie zamierzają poprzestawać: w grę wchodzi dołączanie większych ilości danych genetycznych – ostateczny zbiór może być gigantyczny, mieszcząc informacje o milionach dodatkowych genomów. Co więcej, przytoczona metoda nie musi ograniczać się tylko do naszego gatunku. Można z niej skorzystać również w badaniach z zakresu genetyki medycznej. Więcej informacji w tej sprawie można znaleźć na łamach Science.