Pascal Gagneux가 말라리아 기생충과 다른 병원체가 숙주 세포의 표면과 상호 작용하는 것을 구상 할 때, 그는 화려한 새처럼 오버 헤드로 날아가는 병원성 입자와 함께 미니어처 열대 우림을 묘사합니다. 캐노피는 세포 표면을 장식하는 분지 단 분자로 구성됩니다. “말라리아 기생충이라면, 인간 적혈구에 착륙하고있다”고 말하고“당신이 만진 첫 번째 '잎'은 시알 산이라고 불리는 설탕이라고 샌디에고 캘리포니아 대학의 진화 생물 학자 인 Gagneux는 말했다.
그 상호 작용에 대한 그의 생태적 견해는 조밀 한 서 아프리카 숲에서 야생 침팬지 행동을 연구하는 그의 이전 현장 작업에 뿌리를두고 있습니다. 그 트레킹 중에 그는 자신에게 물어보기 시작했습니다.“왜 같은 DNA를 공유하는 인간과 침팬지가 같은 방식으로 질병을 다루지 않습니까?”
."당신과 나에게 sniffles를주는 질병은 실제로 침팬지를 죽일 것"이라고 그는 설명했다. 그러나 그 반대도 마찬가지입니다. 침팬지는 인플루엔자 A에 취약하지 않으며, HIV 감염은 인간에게 치명적이지만 침팬지에서는 경미합니다. 인간을 죽이는 말라리아 기생충은 침팬지를 감염시킬 수 없으며 그 반대도 마찬가지입니다. 이 홀수 선택성은 영장류에 특이하지 않습니다. 특정 숙주 종을 파괴하는 병원체의 수많은 예가 있습니다.
Gagneux는 대답을 구하기 위해 세포를 으르렁 거리는 "열대 우림 캐노피"에서 글리코 분자 또는 글리 칸의 연구에 피부됐다. 글리 칸은 복잡한 설탕 (다당류)의 화려한 그룹입니다. 셀룰로오스는 포도당의 긴 사슬로 구성된 식물 글리 칸이거나 화학적 특성을 수정하는 단백질 및 지질과 같은 다른 생체 분자에 고정 될 수 있습니다. 그들의 구조는 (셀룰로오스에서와 같이) 선형 일 수 있지만 다양성과 복잡성을 추가하여 매우 고도로 분기 될 수 있습니다.
세포와 종들 사이의 끝없는 변화는 병원체가 특정 숙주 종을 황폐화하지만 다른 숙주 종을 파괴하는 이유의 중심입니다. SARS-COV-2와 같은 특정 전염병 제 (SARS-COV-2와 같은 특정 감염제의“유출”을 한 종에서 다른 종으로 설명하는 데 도움이됩니다. 그러나 그것은 또한 인간 정자와 계란과 자궁 세포 사이의 상호 작용과 같은 종 내에서도 세포 행동의 핵심입니다.
이제 과학자들은 글리 칸과 글리코 생물학을 이해하는 데 획기적인 노력을 기울일 수 있습니다. Harvard University와 Massachusetts Institute of Technology의 포괄적 인 데이터 세트와 알려진 상호 작용의 포괄적 인 데이터 세트를 분석 한 후 일관되고 호환되는 아키텍처를 보장하는 시정촌 건축법과 같이 모든 유기체가 글리 칸을 만들 때 사용하는 공유 구조적 "언어"를 발견했습니다. 연구원들은 누구나 글리 칸 구조와 기능을 분석하는 데 사용할 수있는 일련의 온라인 도구를 발표했습니다.
풍부하지만 신비한
Gagneux의 관심사의 전환은 현재 UCSD의 글리코이학 연구 및 훈련 센터의 의사 과학자이자 공동 이사 인 Ajit Varki를 만났을 때 발생했습니다. Gagneux는 그의 멘토가 된 Varki는“인간과 침팬지의 첫 생화학 적 차이를 우연히 발견했다고 말했다. Varki와 그의 팀은 2 백만 년 전에 인간 조상의 돌연변이가 다른 모든 영장류와 대부분의 다른 포유류에서 시알 산을 수정하는 유전자를 비활성화했음을 발견했습니다. 결과적으로, 다른 영장류 세포에 존재하는 수억 명의 시알 산 글리 칸이 인간으로부터 누락되었습니다.
Varki에게 Glycans는 여전히 생물학적 우주의 가장 큰 수수께끼 중 하나입니다. 그들은 "실제로 매우 두드러지고 지구상의 바이오 매스의 주요 구성 요소입니다." 실제로, 글리 칸은 질량으로 대부분의 유기물을 구성합니다. 셀룰로오스와 키틴은 절지 동물 외골격 및 곰팡이 세포벽의 주요 건축 물질 인 자연의 가장 풍부한 유기농 중합체입니다. 그럼에도 불구하고 글리 칸의 과잉과 달리,“이 모든 분야는 뒤에 남겨졌습니다.”라고 Varki는 말했습니다.
예테보리 대학교의 생물 정보학 연구원 인 Daniel Bojar와 스웨덴의 분자 및 번역 의학을위한 Wallenberg Center는 다른 주요 바이오 폴리머와 비교하여 Glycans Pales :DNA, RNA 및 단백질에 비해 Glycans Pales에 대한 우리의 지식에 동의합니다. 글리 칸은 이메일로 다음과 같이 설명했다.
Varki에 따르면, 현재의 glycobiology의 상태는 생물학에서 주요 변화가 일어 났을 때 20 세기 후반으로 거슬러 올라갑니다. 글리 칸은 1970 년대와 1980 년대 상반기에 심하게 연구되었습니다. “Glycans는 10 년마다 노벨상 1 명으로 매우 두드러졌습니다. 글리 칸을 연구하는 많은 분야에 매우 두드러진 사람들이있었습니다.”라고 그는 말했다.
그러나 Varki는 2017 년 리뷰에서 다음과 같이 썼습니다.“글리코 스 과학 분야는 글리 칸의 합성과 기능에 대한 더 어려운 질문을 조사하는 대신 '묘사 적'탄수화물 화학 및 생화학에서 오랫동안 이들 영역에 남아있었습니다.
.한편, 주요 기술 발전은 유전자 코드 템플릿으로 직접 지정된 긴 선형 분자, 핵산 및 펩티드의 연구를 가속화하고있었습니다. 대조적으로, 글리 칸의 복잡한 분지 구조는 설탕 잔류 물을 첨가하고 변형시키는 일련의 화학 반응을 통해 발생한다. 그들을 연구하기위한 자원의 개선은 없었습니다.
결과적으로 1980 년대 중반까지“DNA, RNA 및 단백질, 모든 분자 생물학이 와서 이륙하여 글리 칸을 역에서 뒤로 두었습니다.”라고 Varki는 말했습니다. 그 발전은 그 당시의 첫 독립 연구 위치를 찾고 있었던 Varki에게 낙담했습니다. 그러나 도전에도 불구하고 그는 다른 많은 연구자들이 그들을 포기할 때에도“나는 이런 것들을 연구하는 데 고수 할 것”이라고 스스로에게 말했다.
.Gagneux는“많은 분자 생물 학자들은 글리 칸에 의해 경계선이 짜여져 있으며, 이는 작고 반투명합니다. "당신은 그들에게 붙어있는 물건을 던지기 시작하는 경우에만 볼 수 있습니다."예를 들어 짧고 독특한 사카 라이드 서열을 태그 할 수있는 단백질입니다. 그러나 이러한 중요한 구성 요소를 연구하는 것을 소홀히한다는 것은 인류의 가장 큰 도전과 질문에 대한 게임 변화 정보가 누락 된 것을 의미 할 수 있습니다.
Beth Israel Deaconess Medical Center와 Harvard Medical School의 수술 교수 인 Richard Cummings는“복잡한 탄수화물의 구조,이 글리코 분자의 구조를 이해하는 데 중점을 둔“생명의 일”을 설명합니다. 그는 글리코 분자는“인체가 만드는 가장 복잡한 구조”라고 말했다.
Cummings는 Worldwide Human Glycome Project의 공동 이사입니다. 그와 2018 년에 시작된이 프로젝트에 대한 다른 연구자들은“인간의 글리 칸과 탄수화물 구조 (글리코 분자)를“서열하고 식별하는 것을 목표로하고있다”고 지적했다. 대조적으로, 인간 게놈 프로젝트는 1990 년에 시작되어 2003 년에 공식적으로 결론을 내렸다.
그러나 연구자들은 이러한 조건을 예방하고 치료하기위한보다 효과적인 전략을 개발하고자한다면 질병과 질병에서 어떤 역할을하는지 결정하는 것이 중요합니다.
질병으로의 분자 창.
그 연구 중 일부는 이미 유익한 것으로 판명되었습니다. Varki에 따르면, 글리코 실화의 결함으로 인한 희귀 유전자 대사 장애의 증가하는 그룹에 대한 연구에서 큰 보폭이 이루어졌다. "1990 년대 초반 느린 시작 후 많은 연구자들의 국제적인 노력이 이제 글리코 실화의 인간 유전 적 장애의 발견에서 진정한 폭발을 일으켰습니다."그는 그의 2017 년 검토 기사에서 썼습니다.
연구원들은 이미 낭포 성 섬유증, 암, 겸상 적혈구 빈혈, HIV 및 COVID-19와 같은 다양한 상태에 대한 새로운 통찰력을 얻기 위해 glycomolecules로 향했습니다. 예를 들어, 2020 년 Cummings와 그의 동료들은 분자 정신과 을 출판했습니다. 정신 분열증 환자의 비정상 글리코 실화에 대한 25 년간의 사후 뇌 연구에 대한 기사를 검토하십시오.
또한 기능성 글리코 믹스 (National Center for Functional Glycomics)와 글리코 과학을위한 하버드 의과 대학 센터 (Harvard Medical School Center)를 지휘하는 커밍스 (Cummings)는 인간 생물학에서 글리코 분자의 기능과 그러한 기능의 돌연변이 또는 변화가 병리를 유발할 수있는 방법을 연구한다. 그는 또한 인플루엔자 감염 및 병든 인간과 같은 박테리아, 기생 벌레 및 바이러스가 어떻게되는지 조사합니다.
Cummings는“이러한 경우 거의 모든 경우에, 미생물과 기생충이 인간 질병을 일으키는 글리코 분자의 상호 작용을 통한 것”이라고 Cummings는 말했다. 그 지식을 새로운 치료법이나 예방 조치와 연결하는 것은 종종 여전히 큰 도전입니다.
글리 칸의 언어를 디코딩하는
Gagneux는 글리코이학의 한 가지 장애물은 침팬지와 인간과 같이 높은 수준의 유전 적 유사성을 갖는 밀접하게 관련된 종들조차도 일정하고 진행중인 공동 진화로 인해 크게 변할 수있는 글리 칸을 가지고 있다고 지적했다. 각 종은 글리 칸 라이브러리에 자국을 남기는 질병으로 인한 자체의 진화론에 직면 해 있습니다. 호스트 글리 시스는 병원체의 공격을 피하거나 반대하는 것으로 진화하며 병원체의 글리코는 잠재적 숙주의 면역 방어를 피하기 위해 진화합니다.
.Gagneux는“이것은 분리 된 진화 방식으로 가면 다르게 발생하는이 분자 무기 경쟁을 일으킨다”고 말했다. 예를 들어, 침팬지 말라리아 기생충에 인간을 주사하더라도 아프지 않습니다. (믿거 나 말거나, 이것은 50 년대에 벨기에에서 이루어졌다”고 말했다.
반면에, 침팬지는 vibrio 이기 때문에 콜레라에 매우 저항력이 있습니다. 질병을 일으키는 박테리아는 인간 장을 감싸는 세포의 시알 산만 표적화하여 막을 통해 구멍을 뚫는 독소를 만듭니다. Cummings는 Glycome에서 호스트-경사 형 Coevolution으로 인해“다양성이 많다”고 말했다.
MIT의 과학자들과 하버드의 WYSS Institute for Biologically Engineering Engineering의 과학자들이 글리 칸 중심의 머신 러닝 모델을 사용하여 19,000 개 이상의 고유 한 글리 칸의 데이터 세트를 분석했을 때이 다양성은 분명했습니다. 여기에는“6,969 진핵 생물, 6,119 원핵 생물 및 152 개의 바이러스 성 글리 칸이 포함되었으며, 2020 셀 숙주 및 미생물 에 썼습니다. 공부.
연구원들은“우리는 글리 칸을 찾을 수있는 모든 종을 포함했기 때문에이 데이터 세트는 현재 알려진 종 관련 글리 칸의 포괄적 인 스냅 샷을 구성했습니다.
Wyss Institute의 박사후 연구원 인 Bojar는 당시 MIT가 연구의 첫 번째 저자입니다. 그와 그의 동료들은 글리 칸 서열에서 1,027 개의 독특한 단순 설탕 (단당류)과 화학 결합을 관찰했습니다. 그들은 이것들을“글리 콜 레터”로 취급했다 -“글리 칸 언어를위한 알파벳의 가장 작은 단위”라고 그들은 썼다. 그런 다음 5 개의 글리콜 레터 (즉, 2 개의 결합으로 연결된 3 개의 단당류)로 정의 된 "Glycowords"패턴에 대한 데이터 세트를 살펴보기 시작했습니다.
.이를 위해, 그들은 데이터베이스의 시퀀스에 대한 양방향 재발 성 신경망을 훈련 시켰으며이를 사용하여 글리콜 레터 기반 언어를위한 모델을 만들었습니다. 이러한 신경망은 일반적으로 언어 모델을 배우고 훈련시키는 데 사용됩니다. WYSS Institute의 선임 스태프 과학자이자 연구 연구원 인 Rani Powers는“일련의 텍스트를 앞으로 읽은 다음 뒤로 읽는 것으로 생각할 수 있습니다. "당신은 문맥에서 모든 단어 나 모든 문자를 꺼내는 것이 아니라 본 경우 본질적으로 문장의 맥락을 유지하고 싶습니다."
.이론적으로, 데이터 세트의 글리콜 레터는 거의 1.2 조의 다른 글리코 포드를 형성 할 수있었습니다. 그러나 놀랍게도, 연구원의 결과는 19,866 개의 별개의 글리코 포드만이 모든 이용 가능한 서열에 걸쳐 존재했음을 나타 냈습니다. 글리 칸의 엄청난 복잡성과 다양성과 다양한 종의 특징 인 글리 칸의 차이에도 불구하고, 증거는 모든 유기체가 그것들을 조립하는 데 매우 유사한 규칙을 따르고 본질적으로 동일한 생체 분자 언어를 사용하여 구조를 정의한다는 것을 제안했습니다.
.연구원들은 모델을 미세 조정함으로써 글리 칸이 온 유기체의 분류 학적 그룹을 높은 정확도로 예측할 수 있음을 발견했습니다. 또한, 그들은 참조 데이터 세트의 글리 칸 서열이 인간에게 면역 원성인지 여부를 약 92% 정확도로 예측하도록 모델을 훈련시킬 수있었습니다.
그 결과는“매우 흥미 진진하고”글리 칸을 이해하기위한 정교한 계산 도구를 추가로 적용하는 것이“중요하고 계시적일 수있다”고 연구에 참여하지 않은 앨버타 대학교의 글리코믹스 연구원 인 라라 마할 (Lara Mahal)은 말했다. (그녀는 Bojar와 다른 프로젝트를 진행하고 있습니다.)“글리 칸의 복잡성을 명확한 패턴으로 줄이는 데 도움이됩니다. 예를 들어 글리 칸의 병원성에 관한 중요한 정보를 수집 할 수 있습니다.”
.WYSS와 MIT 연구원들은 다른 팀이 온라인에서 무료로 개발하고 무료로 게시 한 혈당 디자인 및 분석을위한 도구를 사용하기를 희망합니다. Bojar에 따르면, 그들의 가장 유용한 적용은 제약 산업에있을 수 있으며, 처리 치료 단일 클론 항체를 위해. 항체 단백질은 병원체의 특정 항원 표적에 걸린다. 그러나 항체가 신체 방어의 나머지 부분과 어떻게 상호 작용하는지 결정하는 것은 단백질과 연결된 글리 칸입니다. Bojar는 앞으로이 도구는 예를 들어 부작용을 제한하거나 신체의 반감기를 더 정확하게 보정함으로써 항체의 성능을 향상시킬 수있는 글리 칸을 제안 할 수 있다고 말했다.
Mahal은 이미 도구를 사용하여 세포의 글리 칸을 식별하는 데 사용되는 분석의 특이성에 대해 더 많이 배우고 있다고 지적했습니다. "이 새로운 계산 기술은 고 처리량 분석과 결합되어 글리 시스에 대한 우리의 이해와 질병의 역할에 혁명을 일으킬 것입니다."라고 그녀는 말했습니다.