>> HLK 자연과학 >  >> 생물학

Karen Miga는 우리 게놈의 누락 된 조각을 채 웁니다.


1990 년에 국제 과학자 팀은 인간 게놈을 시퀀싱하려는 야심 찬 시도를 시작했습니다. 2001 년까지 HGP (Human Genome Project)는 거친 초안을 준비했으며 2003 년 4 월에 초안 시퀀스가 ​​완료되었습니다. 그러나 현재 캘리포니아 대학교 (University of California)의 유전 학자 인 산타 크루즈 (Santa Cruz)의 유전 학자 인 카렌 미가 (Karen Miga)는 UCSC Genomics Institute의 부국장이라는 사실을 알았습니다.이 작품이 마무리되었지만 시퀀싱이 완전히 없었다는 것을 알았습니다.

.

HGP는 유전 학자들이 유체 로마틴이라고 부르는 인간 DNA의 90%를 서열 할 수 있었는데, 이는 느슨하게 접 히고 단백질을 활성으로 만드는 거의 모든 유전자를 함유하고 있습니다. 그러나 Miga는 이종 크로마틴, 단단히 포장 된 DNA 섹션을 특수화하여 말단 (텔로미어) 및 염색체의 중심 (중심) 근처에 고도로 반복되는 서열을 갖는다. 당시 과학자들은 헤테로 크로 마틴을 서열 할 수 없었기 때문에 축하 허브 버브와 샴페인 토스트에도 불구하고 게놈의 거의 10%가 시퀀스되지 않았습니다.

.

거의 20 년 동안 그 길을 지켰습니다. 그녀는 일부 유전 학자들이 생각한 것만 큼 중요하지 않다고 믿지 않았기 때문에 문제는 미가에서 잔소리를했다. (순서가 없으면 어떻게 말할 수 있습니까?) 수년 동안, Miga는 계속해서 몇 년 전에 시작한 프로젝트를 완료하기 위해 Genomics 분야를 계속 추진했습니다. DNA 시퀀싱 기술이 한 번에 게놈의 더 길고 긴 스트레칭을 읽을 수있게함으로써 Miga는 과학자들이 문제를 열어질 가능성에 더 가깝게 점점 더 가깝다는 것을 알 수있었습니다.

Miga는 National Human Genome Research Institute의 계산 생물 학자 인 Adam Phillippy와 함께 2018 년 TELMERE-to-TELOMERE (T2T) 컨소시엄을 출시하여 인간 DNA의 모든 뉴클레오티드를 모두 시퀀싱했습니다. 그런 다음 팀이 발판을 찾는 것처럼 전염병이 강타했습니다.

그러나 Covid-19는 그들의 발전을 멈추지 않았습니다. 6 월에 Miga, Phillippy 및 그들의 동료들은 Preprint Server Biorxiv.org에 첫 번째 완전한 게놈 서열을 발표했습니다. 그것이 시작된 지 30 년이 지난 후, 인간 게놈이 마침내 완성되었습니다.

Quanta 화상 채팅에서 Miga와 함께 그녀의 수년간의 작업과 컨소시엄의 성취가 과학에 어떤 의미가 있는지에 대해 논의했습니다. 인터뷰는 명확성을 위해 압축되고 편집되었습니다.



당신은 어떻게 유전체학에 처음 관심을 갖게 되었습니까?

Evan Eichler의 실험실에서 석사 학생이었을 때 Case Western Reserve에서 인간 유전체학과 반복 생물학을 처음 소개했습니다. 그때 인간 게놈 프로젝트의“완성”이 발표되었을 때, 그는 그 분야의 리더 였고 복잡한 영역을 이해하는 데 매우 투자했기 때문에 처음부터 게놈이 불완전하다는 것을 잘 알고있었습니다. 그런 다음 Duke University의 Centromere Genomics and Chromosome Biology의 리더 인 Huntington Willard와 함께 박사 과정을 마쳤습니다. 위성 DNA에 대한 나의 사랑 (탠덤에서 발견되는 서열 반복 또는 종종 수백만 개의베이스에 대한 머리부터 꼬리 마개 배열)에 대한 나의 사랑을 발견 한 것은 헌트의 멘토링에 따라

.

위성 DNA 가란 무엇이며, 인간 게놈이 미완성 된 이유와 무엇과 관련이 있습니까?

짧은 탠덤 반복은 인간 게놈 전체에서 일반적이며 잘 연구되었습니다. 내가 가장 열정적 인 위성 DNA는 게놈 생물학에서 규모와 기능 모두에서 상당히 달랐습니다. 규모의 관점에서, 유전자가 풍부한 영역에 산재 된 것이 아니라, 이들 위성 DNA는 모든 인간 염색체에서 매우 큰 유전자가 빈 지역 (종종 수천만 개의 염기)을 구성한다. 우리는 위성 DNA가 풍부한이 지역이 식물과 동물 게놈의 일반적인 특징이라는 것을 알고 있습니다. 또한, 우리는 그것들이 세포 생존력에 매우 중요하다는 것을 알고 있습니다. 그것들은 세포 분열 동안 염색체가 올바르게 분리되도록하는 게놈의 일부인 Centromere 형성 부위를 표시합니다. 이 엄청나게 이상한 게놈 풍경은 인간 게놈의 초기 어셈블리에서 빠졌습니다. 물론, 그들은 또한 그 어셈블리를 사용하여 새로운 유전자 발견과 인간 질병과의 연관성을 만들어 낸 연구에서 실종되었습니다.

그 시점에서 인간 게놈의 어떤 부분이 후에도 남아 있지 않은가?

인간 게놈에 남아있는 가장 큰 갭은 모두 반복적 인 DNA였습니다. 위성 DNA의 경우 탠덤 반복은 거의 정확한 사본의 선형 배열로 구성됩니다. 하나의 사본을 다른 사본과 구별 할 수있는 단일 뉴클레오티드 변화가있을 수 있으며, 이러한 차이는 수만 개의 기지에 의해 간격이 될 수 있습니다. 한 번에 150베이스 만 시퀀싱 할 수 있다면, 세그먼트가 그 게놈에서 어디에서 왔는지 알 수있는 편지에 충분한 정보가 없을 것입니다. 과거에는 이와 같은 작은 조각을 사용했을 때 반복이 풍부한이 지역을 완전히 해결하는 데 사용할 수 없었습니다. 정확한 맵을 만들 수있는 "Long Read"시퀀스를 볼 수 있습니다.

시퀀싱을 완료하기 위해서는 기술 개선의 문제 일뿐입니까?

우리 팀은 장기 읽기 시퀀싱의 가용성으로부터 절대적으로 혜택을 받았습니다. 그러나 여기서 또 다른 주요 고려 사항은 이러한 긴 읽기를 사용하여 최상의 선형 예측을 만드는 올바른 알고리즘을 개발하는 기술 발전입니다. 또한 T2T 커뮤니티는 이러한 예측의 품질을 평가하기 위해 새로운 분석의 개발을 이끌어 내고 정확합니다.



나는 완전한 인간 게놈 서열을 완성하기 위해 완전한 인간 게놈 서열을 완성하려는 욕구를 이해합니다. 그러나 우리는이 게놈 세그먼트를 후회하지 않도록 남겨두면 무엇을 놓치고 있었습니까?

인간 게놈에서 총 유전자 수를보다 완전하게 평가하는 데 장점이 있습니다. 우리의 사전 인쇄는 수백 개의 단백질 코딩 유전자와 천 개가 넘는 유전자 예측을 확인합니다. 그것은 인간 게놈에 중요한 추가이며 작업에 대한 명확한 장점을 제공합니다.

유전자 외에도, 우리는 염색체의 전체 짧은 팔에 대한 서열을 방출하고 있음을 기억하는 것이 중요합니다. 예를 들어, 염색체 21 (Trisomy 21)의 3 개 사본을 갖는 것은 분명한 임상 적 관심이므로 다운 증후군이 발생하기 때문입니다. 우리는 염색체 21의 짧은 팔의 첫 번째지도를 발표했으며, 이는 기능적 및 임상 연구를 넓힐 수있는 염색체의 게놈 조직에 대한 정보를 추가합니다. 또한, 우리는 이제 센트로 머와 같은 기능적으로 중요한 영역에 대한 명확한 견해를 가지고 있으며,이를 통해 게놈 구성과 구조를 더 잘 이해하기 위해 새로운 연구를 시작하는 데 도움이 될 수 있습니다.

.

게놈 초안이 2001 년에 출판되었을 때 실제로 얼마나 완료 되었습니까?

첫 번째 초안 시퀀스는 놀라운 자원 이었지만, 우리 게놈의 더 복잡하고 조밀하게 반복되는 영역을 의도적으로 무시했습니다. 더 완성 된 주에 도달하려는 노력은 약 8-10%가 여전히 누락되었으며, 우리는 완료에 도달하기 위해 기술 벽을 계속 때렸습니다. 부분적으로 이것은 반복을 시퀀싱하는 데 따른 과제 였지만, 시퀀싱이 완벽하더라도, 우리는 그 조각들을 정리하는 장애물에 직면하게 될 것임을 기억하는 것이 중요합니다.

.

나는 몇 년 동안 비누 상자에 서있는 소규모 과학자 중 한 명인 것 같습니다. 2003 년에“완성 된”인간 게놈의 대중 축하로 인해 많은 사람들이 이것을 배우는 것에 놀랄 것이라고 생각합니다. 우리는 당시 기술적으로 실현 가능한 게놈의 일부를 완성하는 것을 축하했습니다. 우리의 게놈이 얼마나 많이 해결되지 않고 탐구되지 않은지는 대중에게 명확하지 않았습니다.



당신은 T2T 컨소시엄을 향해 인간 게놈의 길고 반복적 인 부분을 매핑하는 데 도움을주었습니다. T2T 컨소시엄은 어떻게 시작 되었습니까?

NHGRI (National Human Genome Research Institute)의 Adam Phillippy와 저는 인간 게놈을 완성하는 데 관심이 있었고 2018 년에 함께 일하기 시작했습니다. 처음에는 완전한 "텔로미어-텔로미어"인간 염색체를 방출하기 시작했습니다. T2T 컨소시엄의 공개 발표는 2019 년 게놈 생물학 및 기술의 발전 회의에서 Adam이 X 염색체를 완성하기위한 우리의 작업을 발표하고 인간 게놈을 완성하기위한 이니셔티브를 발표했다고 발표했습니다.

.

단일 염색체를 완성하려는 노력에 따라, 우리는 매우 정확한 데이터와 매우 긴 판독의 조합을 사용하여 염색체 어셈블리를 개선하는 방법을 계속 연구했습니다. 위성 어레이를 완성하기 위해 더 자동화 된 방법에 도달하기 시작했습니다. 이를 통해 컨소시엄은 재능있는 과학자들의 거대한 캐스트와 함께 더 넓은 풀뿌리 노력으로 성장하고 변화하고있었습니다.

2020 년 여름, 우리는 모든 인간 게놈을 시도하고 마무리하기 위해 집중된 워크샵을 구성했습니다. 이는 가상 팀을 조립, 큐 레이션, 변형 통화 및 반복 생물학에 대한 전용 전문 지식을 갖춘 독특한 작업 그룹으로 구성하는 데 핵심이었습니다. 이 가상 커뮤니티는 (특히 전 세계 유행병 전반에 걸쳐 함께 협력하여 완전한 인간 게놈의 초기 방출과 함께 새로 조립 된 지역의 심층적 인 생물학적 분석을 제공했습니다.

.

길을 따라 직면 한 도전은 무엇입니까?

우리는 몇 가지 도전이있었습니다. 주목할만한 것은 염색체 9의 센트로 미어 옆에있는 긴 위성 DNA 배열이었다. NHGRI의 Adam Phillippy와 그의 팀은 5 개의 아크로 센 트릭 염색체 각각에서 리보솜 DNA 어레이의 서열을 해결하기 위해 집중된 작업에 대해 특별한 신용을받을 자격이 있습니다.

마침내 전체 게놈 어셈블리를 가졌을 때 기분이 어땠나요?

꿈입니다. 이것은 정말로 꿈이 실현되는 것과 같습니다. 나는 대학원생이었을 때 이러한 유형의지도를 갖는 것에 대해 항상 환상을 가지고 있었고, 항상 언젠가 도착할 것이라고 생각했습니다. 이 정보를 발행하고 공유하는 과정의 일부가되어 매우 감사합니다.



마침내 인간 게놈 시퀀싱을 완료했다는 것은 무엇을 의미합니까?

첫 번째 완전한 인간 게놈이 출판되면 획기적인 순간이 될 것입니다. 우리 가이 새로운 게놈 완성과 품질의 표준을 보여줄 것이 처음이 될 것이라는 점에서 큰 기술적 성취가 될 것입니다. 우리는 질병 연관성 및 세포 기능에 대한 연구를 확장하기 위해 인간 게놈에 수억 개의 새로운 탐험되지 않은베이스를 갖기 때문에 광범위한 기본 및 번역 연구 커뮤니티에게는 큰 승리가 될 것입니다. 다음 도전은 수천 명의 사람들이 아니라면 이것을 완전히 일상적으로 만들고 수백에 걸쳐 우리의 연구를 확장하는 것입니다.

이 다음 단계에 도달하기 위해 T2T 컨소시엄은 2020 년에 인간 Pangenome 참조 컨소시엄과 공식적으로 파트너십을 맺었으며, 수백 개의 다양한 인간 게놈으로 구성된 완전한 완성 된 어셈블리에 도달하는 일반적인 목표입니다. T2T 게놈에 도달하는 것이 표준 작동 절차가되도록하기 위해 시퀀싱 기술 및 조립 공정이 미래에 더 간소화 될 수 있기를 바랍니다.

완전한 인간 게놈 서열은 과학자들이 탐구 할 수있게 해줄 기본 과학 질문 중 일부는 무엇입니까?

이 영역의 서열에는 고유 한 특수 모델과 진화 속도가 있으며, 게놈 구조와 기능을 이해하는 데 도움이되는 새로운 유전자 정보를 제공합니다. 우리는 본질적으로 많은 유전자 패밀리, 전체 아크로 중심적 염색체 및 인간 게놈의 새로운 비 코딩 영역을 더 상세하게 연구하는 문을 열었습니다. 저의 실험실은 위성 DNA가 다양한 개인 과이 새로운 서열 변동 원인이 게놈 생물학과 인간 질병에 대한 우리의 이해에 어떻게 기여하는지에 대해 연구하는 데 매우 관심이 있습니다.

그러나 인간 게놈을 완전히 시퀀싱함으로써 다른 중요한 유전학 메커니즘을 이해하는 문을 열었습니다.

.

반복적 인 지역 인 중심 및 기타 지역이 처음으로 우리지도에 존재합니다. 이것은 새로운 발견을위한 대부분의 탐험되지 않은 게놈 환경을 제공하며 질병 연관성의 유전자 연구를 확장 할 수 있습니다. 초기 연구는 게놈의 이들 부분이 인간 기준 게놈의 초기 방출 이후 우리가 집중적으로 연구 한 더 친숙한 유전자가 풍부한 영역과 다르게 조직되고, 복제 및 조절되었음을 시사한다.

.

따라서 T2T Preprint 게놈이 마지막 몇 가지 세부 사항으로 이전 인간 게놈 참조를 토핑하는 것과는 다릅니다. 그것은 우리가 우리에게 이용할 수있는 다른 방식으로 작동하는 게놈의 전체 덩어리가있는 것과 비슷하며, 우리는 그 표면을 긁기 시작했습니다. 다음 10 년은 매우 흥미로울 것이며, 새로 공개 된이 지역에서 미래의 발견을 기대합니다.



  1. RNA 주형에서 DNA를 전사 할 수있는 레트로 바이러스가 장착 된 효소는 무엇입니까?
  2. 분자 맵은 위험한 바이오 호폰을 비활성화하는 방법을 보여줍니다
  3. 체세포와 생식 세포의 차이
  4. 왜 일부 잎에는 머리카락이 있고 일부는 머리카락이 없습니까?
  5. 영양 한천과 영양소 국물의 차이
  6. 상호 작용 및 비 임원 전좌의 차이점은 무엇입니까?