>> HLK 자연과학 >  >> 생물학

DNA에 숨겨진 인류의지도


John Novembre에게 재미있는 시간을 기억하도록 요청하면 최근 일주일 동안 해커 톤에 대해 이야기 할 수 있습니다. 그와 그의 학생들과 박사후의 박사는 일상적인 식사 테이크 아웃과 크 런칭 데이터를 유지해야 할 일일 의무를 따랐습니다.

이것은 계산 생물학자인 Novembre가 순전히 컴퓨터 괴짜라고 말하는 것은 아닙니다 (그는 그것이 그의 정체성의 일부임을 인정할 것입니다). 그렇습니다. 시카고 대학교의 화이트 보드가 늘어선 벽에는 상징과 그래프와 방정식으로 장식되어 있습니다. 영리한 알고리즘의 배아와 전 세계에서 가장 큰 게놈 데이터 세트에서 의미를 높일 수 있습니다. 그러나 그것은 그가하는 일을 엿볼 수 있습니다.

군대 가족으로 태어난 Novembre는 어머니가있는 우루과이에서 3 년을 보내면서 자랐습니다. 인간의 차이에 대한 그의 초기 노출 -“지리를 좋아하고, 언어를 좋아하고, 역사를 좋아했습니다.” - 진화와 유전 적 다양성에 대한 깊은 호기심으로 변했습니다. 그의 작품은 광범위한 야망을 반영합니다. 인구가 시간과 공간이 어떻게 변하는 지 이해합니다. 그는 그룹이 그룹이 확장, 축소, 마이그레이션, 어울리고 진화하고 죽을 때 인류의 유전자 코드가 변화하고 혼합되는 방법을 연구합니다.

그의 수학적 절단은이 노력에서 그를 잘 섬겼습니다. 그의 혁신적인 분석과 복잡한 데이터를 시각화하는 새로운 방법은 조상의 유전자 서명과 유전자와 지리 사이의 놀라운 연결을 보여줍니다. 2015 년 37 세의 나이에 Novembre는“특별한 독창성을 보여준 재능있는 개인”과“중요한 성취의 기록을 바탕으로 중요한 미래 발전에 대한 약속”을 인정하는 MacArthur Fellowship (소위“천재 보조금”)을 수상했습니다.

.

그러나 그의 모든 찬사들에 대해, Novembre는 진정으로 겸손한 것으로 나타 났으며, 동료들의 서류를 인용하여 영어 전공이 Dickinson과 Yeats를 인용하는 방식을 인용합니다. 드라이 세제 브레인 스토밍의 아이 샷 안에 그의 책상 위에 매달려있는 것은 1600 년대의 오래된지도입니다. 세계를 모델링하려는 사람이 항상“매우 불완전한 표현”이 될 것임을 끊임없이 상기시켜줍니다.

.

Quanta Magazine  Novembre와 그의 작품의 동기, 과거를 해석하기 위해 DNA를 사용하는 도전, 유전학 연구의 인종 유산에 대해 이야기했습니다. 대화의 편집 및 응축 버전이 다음과 같습니다.



Quanta Magazine :계산 문제로 유전 적 다양성에 대해 생각하게 된 이유는 무엇입니까?

John Novembre :저에게있어 길은 꽤 멀리 시작됩니다. 고등학교에서 저는 약간의 컴퓨터 프로그래밍 괴상했습니다. 그러나 수업에서 나는 완전히 매력적인 유전자 코드에 대해 배우고있었습니다. 그런 다음 대학에서 스탠포드에서 여름 연구 인턴쉽을 할 기회를 얻었습니다. Luigi Luca Cavalli-Sforza의 실험실에서 인턴을 한 학생의 대화를 들었습니다. 그들이하는 일 (그들이 유명해진 것)은 인간 유전자의 변형, 전 세계에 분산 된 방법, 인류 역사에 대해 우리에게 말할 수있는 것들을 보는 것입니다. 그것은 나에게 흥미로웠다.

나는 홈 캠퍼스로 돌아가서 Quercus gambelii 의 인구 유전학에 관한 실험실을 발견했습니다. , gambel 오크. 나는 많은 분석 도구가 얼마나 어려운지, 유전자 데이터 분석에 얼마나 많은 수학과 계산이 관여하는지 배웠습니다. 갑자기 나는“잠깐만 요. 내가 정말 좋아하는 것 - 프로그래밍 - 왜이 두 가지 열정을 결합하지 않습니까?” 저의 일상적인 활동은 컴퓨터에 얽히게되었지만 더 큰 목적은 지적으로 나를 매료시키는 것입니다. 이것은 유전 적 변화와 시간이 지남에 따라 어떻게 변하는지를 이해하는 것입니다.

경력 초기에, 당신은 PCA (Principal Component Analysis)로 알려진 일반적인 통계 도구에서 결함을 발견하여 파도를 만들었습니다. 이 발견은 어떻게 유전학에서의 작업을 더욱 발전 시켰습니까?

PCA가하는 일은 개인의 유전자 데이터를 가져 와서 몇 숫자로 줄입니다. 이 방법이 어떻게 작동하는지 - 강점과 약점 - - 나는 그것이 생성하는 패턴이 모집단 데이터의 공간 구조를 반영 할 수 있음을 이해했습니다.

조밀 한 샘플링이있는 세계의 한 지역에서 유전자 데이터에 액세스하기를 바랐으므로 인구가 서로 혼합되는 연속 척도에서 어떤 변화가 있는지 알 수있었습니다. 그리고 나는 코넬에서 Carlos Bustamante (Carlos Bustamante)와 협력하여 인간 인구에 적용되는 [게놈 데이터]의 가장 큰 컬렉션 중 하나를 분석하도록 초대되었다는 점에서 매우 운이 좋았습니다. 전체 데이터 세트는 3,192 명의 유럽 개인이었습니다. 샘플의 상당 부분이 조부모가 어디에서 왔는지 말하기 위해 조상 설문지에 응답했으며,이를 바탕으로 우리는 유럽 전역에서 약 37 개의 다른 기원의 샘플이 있다는 것을 알았습니다.

.

그래서 당신은 무엇을 배웠습니까?

우리가 PCA를 적용했을 때, 즉시 우리는이 주요 패턴을 보았습니다. 개인이 유전자 공간에 위치한 곳과 조부모가 온 지리 사이에 눈에 띄는 유사점이있었습니다. 인간 개인이 얼마나 밀접하게 관련되어 있는지를 감안할 때 정말 놀랍습니다. 대부분의 유전 학자들은 대륙 척도 내에서 매우 미세한 구조를 혼란스럽게 할 수 있다고 생각하지 않았을 것입니다.

우리는 얼마나 좋은 규모에 대해 이야기하고 있습니까?

내가 개인을 데리고 지리적 위치를 숨기고지도에 다시 넣으려고했다고 가정 해 봅시다. 내가 얼마나 잘 할 수 있습니까? 우리 가이 일을했을 때, 우리는 종종 수백 킬로미터 이내에 얻을 수있었습니다. 우리가 독일어를 사용하는 스위스와 프랑스어를 사용하는 스위스 대 이탈리아어를 사용하는 스위스를 보았을 때에도 유전자 분포의 변화를 볼 수있었습니다.

조부모의 지리적 좌표가 인간이 얼마나 자주 이동하는지를 감안할 때 내 유전학에 주목할만한 영향을 줄 수 있다는 사실에 놀랐습니다. 이 영향을 어떻게 설명합니까?

이것은 내가 강조하고 싶은 것입니다. 유전학에 미치는 영향은 실제로 엄청나게 작습니다. 우리는 게놈의 많은 위치를보고 매우 작은 효과를 얻을 수 있다는 것입니다. 이것은 빅 데이터의 마법입니다. 매우 미묘한 패턴이 감지됩니다. 따라서 조부모가 사는 곳이 유전학에 큰 영향을 미치는 것은 아닙니다. 실제로는 매우 작은 효과입니다. 그러나 수십만 개의 측정이 있으면 개인이 한 위치에서 다른 위치에서 나오는 것처럼 보일 수 있습니다.

상업 조상 테스트의 윤리에 대한 당신의 생각은 무엇입니까?

나는 그들의 DNA 지점 인 Ancestry.com에 조언합니다. 한편으로, 우리의 유전자지도와 같은 프로젝트는 조상에 대한 학습을위한 이러한 도구의 엄청난 잠재력과 힘을 보여줍니다. 그러나 그것의 엄청난 복잡성도 있습니다. 개인이 어디에서 왔는지에 대해 이야기하는 것이 실제로 무엇을 의미합니까? 우리는 부모님과 조부모가 어디에서 왔는지 이야기하거나 아프리카에서 왔을 때 과거로 돌아갈 수 있습니다. 그리고 우리는 지리적 위치와 어떤 종류의 문화적 또는 민족 인구 측면에서 기원에 대한 다른 아이디어를 가질 수 있습니다.

나는 우리가 아직 유전자 데이터를 사용하여 과거를 해석하는이 문제를 실제로 못 박는 초기에 아직도 있다고 말하고 싶습니다. 우리는 여전히 실제 생물학적 시스템과 인구의 복잡성에 직면하고 있으며, 이는 매우 간단한 역사 모델을 사용하려는 시도 중 일부에 저항합니다.

당신의 작업은 어떤 방식으로 인종에 대한 생각에 영향을 미쳤습니까?

유전학 연구가 어렵고 어두운 역사를 가지고 있음이 분명합니다. 그러나 다양성이 훨씬 더 높이 평가되고 이해되고 소중한시기에 이런 종류의 작업을 수행하는 새로운 세대의 일원이되어 기쁘다.

특정 예를 생각하고 있습니까?

저에게 매우 강력한 사람은 여러 인구에서 가져온 게놈 전체 데이터를 살펴 보는 첫 번째 팀의 일부가되었습니다. 인간 인구마다 가장 다른 영역으로 게놈을 분류 한 다음“좋아요

이 연습을한다면 목록의 매우 극단적 인 상단에서 피부 색소 침착, 눈 색깔, 머리 색깔의 변형을 볼 수 있습니다. 따라서 우리가 서로의 차이를보기 위해 사용하는 것은 인간 게놈의 특이 치라는 것이 경험적 사실입니다. 인간 게놈의 평균 유전자 세트는 전 세계적으로 훨씬 더 유사합니다.

당신은 3 개의 회색 늑대 종의 첫 번째 전체 게놈 서열을 분석하고 그것들을 3 개의 개 종의 게놈과 비교했습니다. 무엇을 발견 했습니까?

그것은 큰 놀라움이었습니다. 우리는 세 가지 개 계보가 세 가지 늑대 계보 중 하나와 가장 밀접한 관련이 있다고 생각할 것이라고 생각했습니다. 예를 들어, 개가 중동에서 길들여 졌기 때문에 그들은 모두 이스라엘 늑대와 관련이있을 수 있습니다. 또는 개가 두 건의 가축이 있었을 수도 있고, 딩고는 중국 늑대와 관련이있을 것이고, 바젠지는 크로아티아 늑대와 관련이있었습니다.

그러나 우리가 본 것은 세 마리의 개가 서로 가장 밀접하게 관련되어 있지만 세 늑대의 계보에 포함되지 않았다는 것입니다. 우리의 가설은 개가 멸종되었다는 늑대 계보가 있다는 것입니다. 이 이야기는 엄청나게 복잡해졌고 마지막 장이 아직 쓰여지지 않았다고 생각합니다.

당신은 개 사람입니까?

특히 그렇지 않습니다. 나는 나의 동기가 주로 전체 분야에 대한이 더 큰 도전을 해결하려고 노력하는 것이라고 말할 것이다. 즉, 오늘날 우리는 과거의 기록으로 DNA 서열을 어떻게 사용합니까? 당신은 나에게 종 이름을 교환 할 수 있지만 여전히 흥미 롭습니다. 여전히 재미있는 문제입니다.

유전자 데이터 분석에 대한 귀하의 접근 방식은 시간이 지남에 따라 진화 했습니까?

데이터 시각화를 향한 작업에서 움직임이 증가하고 있습니다. 눈은 실제로 많은 양의 정보를 처리하고 복잡한 패턴을 해석 할 수 있습니다. 올바른 시각화 도구를 사용하면 데이터의 주요 특징과 생물학적 과정을 반영하는 방법에 대한보다 직접적이고 직관적 인 이해를 얻습니다.



예를 들어 줄 수 있습니까?

우리가 개발 한 도구 중 하나는 풍경에서 유전자 흐름이 얼마나 많거나 적은 곳, 즉 개인이 집단 사이에서 어떻게 이동하는지 알려주는 방법입니다. 우리의 분석은 지리적 거리 단위당 예상보다 유전 적 차이가 더 많은 영역과 다른 영역이없는 영역을 유도합니다. 따라서 우리는 낮은 마이그레이션 영역을 나타 내기 위해 갈색과 파란색으로 채색 된 지리적지도를 생성 할 수 있습니다.

예를 들어, 우리는 아프리카 전역에서 샘플링 된 1,000 개 이상의 코끼리의 유전자 데이터를 살펴 보았습니다. 우리의 접근 방식으로, 당신은 사전 지식없이 데이터를 공급 하고이 마이그레이션 률 맵을 얻습니다. 이 브라운 장벽은 중앙 아프리카 마킹을 통해 이동이 적고 이동이 높은 동쪽에는 푸른 복도가있는 곳이 있습니다. 물론, 생태를 알고 있다면, 당신은 다음과 같이 이해합니다.“오! 그것은 한쪽의 숲 코끼리와 다른쪽에는 사바나 코끼리입니다.”

.

이 방법을 다른 인구에 적용 했습니까?

예. 예를 들어, 유럽의 인간 데이터에서 실행할 때, 우리는 영국과 프랑스 사이의 마이그레이션 감소의 갈색 영역을 유추하여 본질적으로 영어 채널을 나타냅니다. 우리는 스칸디나비아와 영국 사이의 바이킹 접촉과 같은 역사적 연결로 인해 북해에서 많은 파란색 (높은 이동)을 볼 수 있습니다. 그런 다음 스위스와 오스트리아 주변에서 갈색이 어둡게 보입니다.

.

풍경과 지배하지 않는 것처럼 보이지 않는 낮거나 높은 마이그레이션 영역과 같은 수수께끼의 결과를 얻었습니까?

유전학이 지질 학적 특징과 얼마나 자주 일으키는 지에 대해 더 놀랐습니다. 당신은 살아있는 개인을 데리고 몸에서 분자를 추출하여 서로 비교하기 시작하며 알프스가 우리 지구의 특징임을 알 수 있습니다. 일종의 야생입니다.

시작했을 때의 질문은 어떻게 바뀌 었습니까?

데이터 유형이 변경되었고 데이터 규모가 변경되었습니다. 박사 학위를 위해, 나는 71 명의 집단에서 관찰 된 단일 유전자 변이에서 내가 할 수있는 것을 배우기 위해 노력했다. 이제 수백만 변형이있는 데이터 세트를 갖는 것이 전혀 일상적입니다. 나는 우리가 오늘날 우리가있는 곳에있을 것이라고 상상할 수 없었습니다. 그래서 그것은 놀라운 게임 체인저이지만 핵심 질문은 여전히 ​​동일합니다. 우리는 어떻게 인구 유전자 데이터를 해석하기 위해 수학 및 통계 모델을 사용합니까?

해결하고자하는 큰 남은 문제는 무엇입니까?

하나의 성배는 시간과 공간을 통해 이주율과 인구 규모가 어떻게 변하는지를 추론 할 수있는 방법이라고 생각합니다. 인구와 인구 통계 기록에 대한 매우 완전한 설명이 될 것입니다.



  1. 미생물과 미생물의 차이점은 무엇입니까?
  2. 왜 어떤 사람들은 부끄러워합니다
  3. 숨겨진 군대 :불가사리가 산호초를 공격하기 위해 숫자를 쌓을 수있는 방법
  4. 가을의 붉은 잠자리는 어디에서 왔습니까?
  5. 야생형과 돌연변이 체의 차이
  6. 물리 원리를 사용하여 세포가 개발중인자가 자습 방법을 이해합니다.