딥 러닝이 고생물학 자와 유전 학자들이 유령을 찾는 데 도움이 될 수 있습니까?
현대인이 70,000 년 전에 아프리카에서 처음으로 이주했을 때, 현재 멸종 된 최소한 두 개의 관련 종이 이미 유라시아의 땅에서 이미 그들을 기다리고있었습니다. 이들은 네안데르탈 인과 데니 소반 인, 초기 현대인들과 교차 한 고풍스러운 인간이었다.
그러나 더욱 복잡하고 다채로운 역사에 대한 힌트가 커지고 있습니다. 예를 들어, 지난 여름, 시베리아 동굴에서 발견 된 뼈 조각은 네안데르탈 인 어머니와 데니 소반 아버지의 딸에 속했다. 이 결과는 1 세대 인간 하이브리드의 첫 번째 화석 증거를 나타 냈습니다.
불행히도, 그러한 화석을 찾는 것은 매우 드 rare니다. (예를 들어 Denisovans에 대한 우리의 지식은 단순한 손가락 뼈에서 추출한 DNA를 기반으로합니다.) 다른 많은 조상 쌍은 이전 십자가의 하이브리드 그룹을 포함한 것을 포함하여 쉽게 변할 수 있지만 물리적 증거와 관련하여 실제로는 보이지 않을 수 있습니다. 그들의 발생에 대한 단서는 대신에 일부 사람들의 DNA에서만 살아남을 수 있으며, 심지어 네안데르탈 인과 데니 소반 유전자의 징후보다 미묘 할 수 있습니다. 통계 모델은 과학자들이 화석 데이터없이 이러한 인구의 존재를 추론하는 데 도움이되었습니다. 예를 들어, 2013 년 말에 발표 된 연구에 따르면 고대와 현대 인간의 유전자 변이 패턴은 데니 소바 (또는 그 조상)와 교차하는 알려지지 않은 인구를 가리 킵니다. 그러나 전문가들은 이러한 방법이 필연적으로 많은 것을 간과한다고 생각합니다.
오늘날의 게놈에 누가 기여 했습니까? 이 소위 유령 인구는 어떻게 생겼는지, 어디에서 살았으며, 다른 인간 종과 얼마나 자주 상호 작용하고 짝짓기를 했습니까?
지난 달 Nature Communications 에 출판 된 논문에서 연구원들은 딥 러닝 기술이 전문가가 알지 못했던 일부 누락 된 작품을 채우는 데 도움이되는 잠재력을 보여주었습니다. 그들은 딥 러닝을 사용하여 다른 유령 인구의 증거를 사용하여 유라시아의 알려지지 않은 인간 조상, 아마도 네안데르탈 인-데니 소반 하이브리드 또는 데니 소반 라인의 친척 일 것입니다.
.이 작업은 고생물학에서 인공 지능의 미래의 유용성을 지적합니다. 예상치 못한 유령을 식별 할뿐만 아니라 우리가 된 사람을 형성 한 진화 과정의 매우 희미한 발자국을 발견하기 위해.
.미묘한 서명 검색
현재의 통계적 방법은 공유 특성에 대해 한 번에 4 개의 게놈을 검사하는 것을 포함합니다. 그것은 유사성에 대한 테스트이지만 반드시 실제 조상의 것은 아닙니다. 왜냐하면 그것이 발견하지 못하는 소량의 유전자 혼합물을 해석하는 방법은 여러 가지가 있기 때문입니다. 예를 들어, 이러한 분석은 현대 유럽이 네안데르탈 인 게놈과 특정 특성을 공유하지만 현대 아프리카 인은 아님을 시사 할 수 있습니다. 그러나 이것이 반드시 그 유전자가 네안데르탈 인과 유럽인의 조상들 사이의 교배에서 비롯된 것임을 돌로 설정 한 것은 아닙니다. 예를 들어, 후자는 대신 네안데르탈 인과 밀접한 관련이 있지만 네안데르탈 인 자체는 다른 인구를 자란 수있었습니다.
우리는 그 고대의 가상의 유전 적 변이원이 언제, 어디서 살았는지, 어디서, 어디서 살았는지 나타내는 물리적 증거가 없을 때, 어떤 유추 조상 중 어느 것이 가장 가능성이 있는지 말하기가 어렵 기 때문입니다. 위스콘신-마디슨 대학교의 고생물학자인 존 호크스 (John Hawks)는“단순성으로 인해 강력하지만 진화를 이해하는 측면에서 많은 것을 남기고있다”고 말했다.
새로운 딥 러닝 방법은 일반적인 통계적 접근 방식에 비해 너무 작은 유전자 흐름의 수준을 설명하고 훨씬 더 광대하고 복잡한 모델을 제공함으로써 더 나은 노력을 시도하는 것입니다. 신경망은 훈련을 통해 인구 통계 학적 역사가 그 연결을 만드는 방법을 알지 못한 채 인구 통계 학적 역사가 발생했을 가능성이 가장 높은 방법에 따라 게놈 데이터의 다양한 패턴을 분류하는 법을 배울 수 있습니다.
이러한 딥 러닝을 사용하면 우리가 의심하지 않은 유령을 발견 할 수 있습니다. 우선, 네안데르탈 인, 데니 소반 및 현대 인간이 그림에서 유일한 세 명의 인구라고 생각할 이유가 없습니다. Hawks에 따르면, 수십 명이있을 수 있습니다.
뉴욕의 스토니 브룩 대학교 (Stony Brook University)의 인류 학자 인 제이슨 루이스 (Jason Lewis)는 그 견해를 공유합니다. "우리의 상상력은 살아있는 사람들이나 유럽, 아프리카 및 서부 아시아에서 찾은 화석에 초점을 맞추면서 제약을 받았습니다." “딥 러닝 기술이 이상한 방식으로 할 수있는 일은 가능성을 다시 초점하는 것입니다. 이 접근법은 더 이상 우리의 상상력에 의해 제한되지 않습니다.”
시뮬레이션 된 역사의 실제 가치
딥 러닝은 일반적으로 많은 양의 훈련 데이터가 필요하기 때문에 고생물학 자의 문제에 대한 해결책처럼 보일 수 있습니다. 이미지 분류기로 가장 일반적인 응용 프로그램 중 하나를 사용하십시오. 전문가들이 고양이의 이미지를 식별하기 위해 모델을 훈련 시키면, 훈련 할 수있는 수천 장의 사진이 있으며, 고양이가 어떻게 생겼는지 알고 있기 때문에 그것이 작동하는지 스스로 알고 있습니다.
.그러나 관련 인류 학적 및 고생물학적 데이터의 부족은 이용 가능한 강제 연구자들이 자신의 데이터를 만들어 영리하게 딥 러닝을하고 싶었던 강제 연구원들에게 도움이되었습니다. 바르셀로나의 전국 게놈 분석 센터 (National Genomic Analysis of Genomic Analysis)의 연구원이자 연구 저자 중 한 명은“우리는 더러운 연주를하고있었습니다. "우리는 시뮬레이션을 사용하고 있었기 때문에 무한한 양의 데이터를 사용하여 딥 러닝 엔진을 훈련시킬 수 있습니다."
연구원들은 인구 통계 학적 세부 사항의 다른 조합, 즉 조상 인간 인구의 수, 크기, 서로 분기 될 때의 크기 등, 혼합 속도 등을 기반으로 수만 건의 시뮬레이션 진화 역사를 생성했습니다. 시뮬레이션 된 역사로부터 과학자들은 오늘날 사람들을 위해 수많은 시뮬레이션 된 게놈을 생성했습니다. 그들은이 게놈에 대한 딥 러닝 알고리즘을 훈련 시켜서 어떤 종류의 진화 모델이 주어진 유전자 패턴을 생산할 가능성이 가장 높은지 배웠습니다.
그런 다음 팀은 인공 지능을 느슨하게하여 실제 게놈 데이터에 가장 적합한 역사를 유추했습니다. 결국,이 시스템은 이전에 미확인 된 인간 그룹이 또한 아시아 출신의 사람들의 조상에 기여했다고 결론 지었다. 관련된 유전 적 패턴으로부터, 그 인간은 아마도 30 만 년 전에 Denisovans와 Neanderthals의 교배에서 발생한 뚜렷한 집단이거나 얼마 지나지 않아 Denisovan 계보에서 내려온 그룹이었을 것입니다.
.딥 러닝이 이런 식으로 사용 된 것은 이번이 처음이 아닙니다. 이 분야의 소수의 실험실은 다른 진화 적 조사 스레드를 해결하기 위해 유사한 방법을 적용하고 있습니다. 오레곤 대학교 (University of Oregon)의 Andrew Kern이 이끄는 한 연구 그룹은 시뮬레이션 기반 접근 방식과 기계 학습 기술을 사용하여 인간을 포함한 종의 다양한 모델을 구별했습니다. 그들은 진화에 의해 선호되는 대부분의 적응이 인구에서 유익한 새로운 돌연변이의 출현에 의존하지 않고 대신 이미 존재했던 유전자 변이체의 확장에 의존한다는 것을 발견했다.
.Kern은“이 새로운 질문에”딥 러닝을 적용하면서“흥미로운 결과를 낳는다”고 말했다.
새로운 도구에 대한 희망 대 희망
물론 큰 경고가 있습니다. 우선, 실제 인간의 진화 역사가 이러한 딥 러닝 방법이 훈련되는 시뮬레이션 된 모델과 비슷하지 않으면 기술이 잘못된 결과를 낳습니다. 그것은 컨과 다른 사람들이 다루려고 시도한 문제이지만 정확성에 대한 더 큰 보증을 제공하기 위해 많은 작업이 계속되고 있습니다.
.프린스턴 대학교의 생태 학자이자 진화 생물 학자 인 조슈아 아키 (Joshua Akey)는“AI는 유전체학에 적용하는 데 과장되어 있다고 생각한다. “딥 러닝은 환상적인 새로운 도구이지만 또 다른 방법 일뿐입니다. 인간의 진화에서 우리가 배우고 싶은 모든 신비와 합병증을 해결하지는 않을 것입니다.”
일부 전문가들은 훨씬 회의적입니다. 하버드 대학교 (Harvard University)의 고생물학자인 데이비드 필 (David Pilbeam)은 이메일로 썼다.
그럼에도 불구하고, 다른 고생물학 자와 유전 학자들의 의견에 따르면, 그것은 수천 년 전부터 인간 사이에 존재했던 미래의 화석 발견과 예상 유전 적 변화에 대한 예측에 사용될 수있는 좋은 발전입니다. Lao는“딥 러닝은 실제로 인구 유전학을 부스트 할 것이라고 생각합니다.
데이터에 액세스 할 수있는 다른 필드에서도 마찬가지 일 수 있지만이를 생산 한 프로세스는 그렇지 않습니다. Kern과 다른 인구 유전 학자와 진화론 생물 학자들은 자신의 질문을 해결하기 위해 시뮬레이션 기반 AI 기술을 개발하고 있었을 때, 물리학 자들은 대형 Hadron Collider 및 기타 입자 가속기에서 생성 된 수많은 데이터를 살펴 보는 방법을 알아 내기 위해 노력하고있었습니다. 지질 연구 및 지진 예측 방법도 이러한 종류의 딥 러닝 접근법으로부터 혜택을 받기 시작했습니다.
“이것이 이끄는 곳에서는 정말로 모릅니다. 매사추세츠 공과 대학과 하버드 대학교의 브로드 연구소의 계산 생물 학자 인 닉 패터슨 (Nick Patterson)은 말했다. “그러나 항상 새로운 방법을 보는 것이 좋습니다. 우리가 대답하고자하는 질문에 잘 대답하는 데 도움이된다면 가능한 모든 것을 사용할 것입니다.”
.이 기사는 에 재 인쇄되었습니다 wired.com .