전산 생물 학자 Bruno Correia는 그의 실험실에서 규칙을 가지고 있었다. 그는 실제 과학을 고려하지 않았습니다. 이제 Correia는 기존의 방법보다 40,000 배 빠른 많은 생물학적 과정을 담당하는 복합 접힌 분자 인 단백질 간의 잠재적 인 상호 작용을 탐지하는 데 사용했습니다. 저널 자연 방법 Correia는 2020 년 2 월에 그의 시스템을 표지에 선보였습니다. Correia는 기계 학습을 받아들이기를 꺼려했다고 말했습니다.
그의 마음이 어떻게 바뀌 었습니까? 기하학적 딥 러닝 :곡선 표면에서 패턴을 배울 수있는 인공 지능의 새로운 하위 필드.
단백질은 3 차원 퍼즐 조각처럼 울퉁불퉁하고 불규칙한 모양을 함께 맞추고 상호 작용합니다. 연구원들은 수십 년 동안 그들이 어떻게 그렇게하는지 알아 내려고 노력해 왔습니다. 20 세기 중반부터 과학자들에게 도전 한 잘 알려진 단백질 폴딩 문제는 단백질의 구성 아미노산과 최종 3D 형태 사이의 연결을 해독하여 단백질 상호 작용을 이해하려고 시도합니다. 1999 년에 IBM은 폴딩 문제를 해결하기 위해 Blue Gene Supercomputers 라인을 개발하기 시작했습니다. 20 년 후, DeepMind는 최첨단 딥 러닝 알고리즘을 적용했습니다.
Masif (분자 표면 상호 작용 지문의 경우 짧음)라고하는 Correia의 시스템은 분자의 내부 구조를 무시하여 단백질의 3D 모양의 고유 한 복잡성을 피합니다. 대신,이 시스템은 연구자들이 상호 작용 지문이라고 부르는 것에 대해 단백질의 2D 표면을 스캔합니다. 다른 단백질이 거기에 결합 할 수 있음을 나타내는 신경망에서 배운 기능. “아이디어는 두 분자가 함께 모일 때, 그들이 본질적으로 서로 제시하는 것은 그 표면이라는 것입니다. 하버드 의과 대학 (Harvard Medical School)의 단백질 연구원 인 모하메드 알키리시 (Mohammed Alquraishi)는 딥 러닝을 사용하는 모하메드 알렉 푸라시 (Mohammed Alquraishi)가 말했다. "매우 혁신적입니다."
단백질 상호 작용을 예측하기위한 Masif의 표면 중심 프레임 워크는 소위 De Novo 단백질 설계를 가속화하는 데 도움이 될 수 있으며, 이는 자연적으로 발생하는 품종에 의존하기보다는 유용한 단백질을 처음부터 합성하려고합니다. 그러나이 시스템 개발을 도왔던 Imperial College London의 기하학적 딥 러닝 전문가 인 Michael Bronstein은 기본 생물학에도 사용될 수 있다고 말했다. "암은 단백질 특성에 어떤 영향을 미칩니 까?" 그는 말했다. “암의 결과로 돌연변이가 단백질에서 무언가를 파괴하여 그들이 예상되는 것에 결합하지 않음으로써 다른 방식으로 작동하게하는지 물어볼 수 있습니다. [Masif]는 근본적인 질문에 대답 할 수 있습니다.”
피부 깊이
딥 러닝이 단백질 지문을 어떻게 만들 수 있는지 이해하려면 2000 년대 초반부터 디지털 카메라를 보는 것이 좋습니다. 이 모델에는 비교적 간단한 작업을 수행 한 얼굴 감지 알고리즘이있었습니다. "눈, 코, 입 등의 얼굴이 있음을 감지해야합니다."코가 길거나 코가 짧은 코, 뚱뚱한 입술 또는 얇은 입술이 있는지 여부에 관계없이 "
.현대 카메라는 더 다재다능합니다. 특정 사람을 식별 할 수있어 사진 라이브러리를 빠르게 검색하여 모든 사진을 찾을 수 있습니다.
이 발전은 심층 신경망에 의해 가능해졌으며, 이로 인해 컴퓨터는 훈련 데이터에서 개인의 미묘한 기능을 배울 수있는 방법을 제공했습니다. 이 과정에는 특정 얼굴의 많은 인스턴스를 네트워크에 공급하고 모두 같은 사람으로 표시하는 것이 포함됩니다. 당신은 컴퓨터에 사전에 어떤 속성이 녹색 눈, 넓은 눈썹, 검은 머리카락의 혼합물이 다른 사람이 아닌 자신의 얼굴에 더해 지는지 미리 알릴 필요가 없습니다. 대신, 충분히 적절하게 표시된 예제로 네트워크는 차이 자체를 배웁니다.
Masif는 단백질에 대해서도 같은 일을합니다. 상호 작용 지문에 대한 이전의 접근법은 기본 얼굴 탐지 알고리즘과 같았습니다. 그들은 연구자들이 특정 형상과 크기의 단백질 표면에 울퉁불퉁 한 패치 인 특정 기하학적 패턴을 미리 정의 한 다음 일치를 검색해야했습니다. 대조적으로 Masif는 단백질 상호 작용과 관련된 소수의 기본 표면 특징으로 시작합니다. 예를 들어, 표면의 물리적 곡률 (손잡이 또는 포켓으로), 전하 및 물을 격퇴하거나 끌어 당기는 지 여부. 그런 다음 훈련 중에 네트워크는 이러한 기능을 다양한 상위 수준의 패턴을 감지하는 지문으로 결합하는 방법을 배웁니다.
최근까지, 이런 종류의 기계 학습은 단백질의 곡선이 불규칙한 표면에 사용할 수 없었습니다. 기하학적 딥 러닝의 증가는 가능성을 열었습니다. Correia는 Bronstein에게 2018 년 2 월 Bronstein의 집에서 2 주간의 협력 에서이 방법을 주목했다고 인정했습니다.“전적으로 그 사람이었습니다. "우리의 수제 설명자는 아무데도 가지 않았습니다."
MASIF 사이트라고 불리는 시스템의 한 버전은 단백질의 전체 표면을 검사하고 다른 단백질이 곡선 캔버스에 표적을 칠하는 것과 유사한 접근법 인 다른 단백질이 가장 큰 위치를 예측할 수 있습니다. Correia는“이것은 우리가 한 바디 문제라고 부르는 것입니다. "특정 단백질의 기능적 부위가 어디에 있는지 이해하는 방법으로 이것에 대해 생각할 수 있습니다." MASIF 사이트는이 작업에서 두 개의 주요 사이트 상호 작용 예측 변수보다 약 25% 더 잘 수행했습니다.
Masif-Search라고 불리는 시스템의 다른 버전은 Correia가 다수의 문제라고 부르는 것을 다루고 있습니다. 하나의 단백질이 하나의 표적 분자 (일반적으로 도킹 시뮬레이션에서 발생하는 것처럼)와 어떻게 맞는지 예측하는 대신 시스템은 많은 단백질의 상호 작용 지문을 다른 많은 단백질과 비교하여 적합합니다. Correia는“세포에는 10,000 개의 단백질이 있으며, 많은 단백질이 항상 서로 충돌하고 있습니다. 그것은 무작위 100 개의 단백질 세트 내에서 약 절반의 잠재력에 맞는 것을 발견했습니다. 그러나 도킹 예측자는 검색을 수행하는 데 거의 100 일 분량의 컴퓨팅 시간이 필요했습니다. Masif는 4 분이 걸렸습니다.
브론 슈타인은 그 대규모 속도가 기본 연구를위한“흥미로운 가능성”이라고 말했다. 결국, 인체에서 단백질은 수만 개의 상호 작용을 포함하는 기능적 네트워크를 형성합니다. 브론 슈타인은“이 그래프를 구성하는 데는 많은 시간이 걸립니다. "[MASIF와 같은] 방법을 사용하면 근사치 일뿐 만 아니라 모든 유기체에 대한 단백질 대단사 네트워크의 거친 버전을 구축 할 수 있습니다."
.Alquraishi는 단백질 상호 작용을 예측하기위한 Masif의 피부 깊은 접근 방식이 의미가 있지만, 유도 된 적합이라는 현상을 포착 할 수 없었습니다. 다시 말해, 두 단백질의 표면은 이미 거의 만지기 전까지는 보완적인 지문을 나타내지 않을 수 있습니다. Masif가 놓칠 요인은 단백질 표면 아래의 구조에 달려 있기 때문에 Masif가 놓칠 수 있습니다. Alquraishi는“진화가 최적화되는 것은 정확히 유도 된 적합도입니다. "[MASIF]의 놀라운 점은이 경고에도 불구하고 여전히 잘 작동한다는 것입니다."
유도 된 착용감 및 기타 표면 역학을 Masif에 통합하는 것은 Correia가 탐구 할 계획입니다. "나에게 그것은 [단백질] 기능을 이해하는 마지막 국경이다"고 그는 말했다. "아마도 나는 앞으로 10 년을 보내는 방법 일 것입니다." 그러나 현재 그는 다른 압박 사업을 가지고 있습니다. Masif를 사용하여 SARS-COV-2의 표면을 연구하는 스파이크 모양의 단백질을 스캔하여 COVID-19를 유발하는 바이러스입니다. "우리는 그 바이러스에 어떤 지문이 있는지 보려고 노력하고있다"고 그는 말했다. "바이러스에는 우리가 이미 알고있는 것 외에도 바이러스에 공격을 시도 할 수있는 곳이있는 것처럼 보입니다." Correia는 이미 SARS-COV-2에 대한이 정보를 사용하여 항 바이러스 단백질을 처음부터 합성하고 있습니다. 그는 올해 결과를 게시하기를 희망합니다. "바이러스가 숙주 세포에 침입하는 방식을 억제하기 위해 바이러스 단백질의 표면 지문에 기초하여 새로운 단백질을 설계 할 수 있다면, 그것은 매우 흥미로울 것"이라고 그는 말했다. "그게 나를 침대에서 꺼내는 것입니다."