수학적 단순성은 진화 속도를 유도 할 수 있습니다

창조론자들은 진화가 하나의 중간 크기의 인간 단백질 만 만들기 위해 올바른 순서로 300 개의 아미노산을 조립해야한다고 주장하는 것을 좋아한다. 20 개의 가능한 아미노산이 각각의 위치를 차지할 수있게되면, 관찰 가능한 우주의 원자 수를 중요하지 않은 수량으로 삼는 20 개 이상의 가능성이있는 것으로 보인다. 우리가 이러한 서열 중 일부를 효과적으로 동등하게 만들 수있는 중복을 할인하더라도, 진화가 수십억 년 이내에 임의의 돌연변이를 통해 올바른 조합에 걸려 넘어지는 것은 매우 불가능했을 것입니다.

그들의 논쟁의 치명적인 결함은 진화가 시퀀스를 무작위로 테스트하는 것이 아니라 자연 선택 과정 이이 분야를 우연히 발견했다는 것입니다. 더욱이, 자연은 어쨌든 다른 단축키, 광대 한 가능성의 공간을 더 작고 탐색 가능한 서브 세트로 좁힐 수있는 방법을 발견 한 것으로 보인다.

컴퓨터 과학자들은 천문학적으로 거대한 가능성 사이에서 최적의 해결책을 찾는 문제와 관련된 문제와 비슷한 도전에 직면합니다. 일부는 생물 학자들이 여전히 삶을 어떻게 지키려고 노력하더라도 영감을 위해 생물학을 보았습니다.

유전자 알고리즘, 수십 년 동안 인기있는 최적화 방법은 자연 선택의 원칙을 사용하여 새로운 설계 (로봇, 약물 및 운송 시스템의 경우), 신경망을 훈련 시키거나 데이터를 암호화 및 해독하는 데이터를 엔지니어링합니다. 이 기술은 무작위 솔루션을 문제에 대한 문제로 취급하여 코드에 설명 된 특정 특징이나 요소를“유전자”를 가진“유기체”로 취급함으로써 시작됩니다. 이러한 솔루션은 특히 좋지는 않지만, 2 세대 유기체를 생산하기 위해 무작위 돌연변이 (때로는 유전자 셔플 링 과정을 모방하는 다른 변화)의 조합을 겪고 있으며, 이는 원하는 작업을 수행 할 때“피트니스”를 테스트합니다. 결국,이 과정의 많은 반복은 매우 적합한 개인 또는 해결책으로 이어집니다.

일부 전문가들은 유전자 프로그래밍이라고 알려진 방법에서 프로그램을 작성하고 솔루션을 효율적으로 발전시킬 수있는 소프트웨어를 발전시키기 위해이 방법을 한 단계 더 발전시키고 있습니다 (여기서 "유전자"는 프로그래밍 지침이 될 수 있음). 연구자들이 특정 데이터 유형과 구조뿐만 아니라 다른 조건을 고려해야했기 때문에이 목표는 특히 까다로워졌습니다.

그러나 흥미롭게도, 이러한 진화 기반 사고 방식 (특히 유전자 프로그래밍)은 생물학과 컴퓨터 과학의 부업에 크게 떠오르는 수학적 이론과 개념적으로 겹칩니다. 소수의 과학자들은 최근 자연과 인공적인 진화가 어떻게 효율적이고, 참신함을 창출하고, 배우는 법을 배우는 방법에 대한 통찰력을 얻기 위해 그것을 사용하려고 노력해 왔습니다. 핵심 :실질적인 적용이 많지 않은 복잡성, 무작위성 및 정보에 대한 특정 개념 - 지금까지.

키보드의

원숭이

1960 년대에 개발 된이 이론은 알고리즘 정보로 알려진 것을 다룹니다. 출발점으로 확률과 복잡성에 대한 직관적 인 사고 방식이 필요합니다. 적어도 일부 출력의 경우 실제로 생성하는 것보다 무언가를 생성하는 방법을 설명하는 것이 더 쉽다는 생각입니다. 컴퓨터에서 원숭이 프레스 키의 잘 짜여진 비유를 무작위로 사용하십시오. Pi의 처음 15,000 자리를 입력 할 가능성은 터무니없이 슬림합니다. 원하는 수의 숫자가 증가함에 따라 기하 급수적으로 감소합니다.

그러나 원숭이의 키 스트로크가 PI를 생성하기위한 무작위로 작성된 컴퓨터 프로그램으로 해석되면 성공 가능성 또는 "알고리즘 확률"은 극적으로 향상됩니다. 예를 들어 프로그래밍 언어 C에서 Pi의 처음 15,000 자리를 생성하기위한 코드는 133 자에 불과합니다.

다시 말해, 알고리즘 정보 이론은 본질적으로 일부 유형의 출력을 생성 할 확률은 임의성이 출력 자체 수준보다는이를 설명하는 프로그램 수준에서 운영 될 때 훨씬 더 크다고 말합니다. 해당 프로그램은 짧기 때문입니다. 이런 식으로 복잡한 구조 (예 :프랙탈)는 우연히 더 쉽게 생산할 수 있습니다.

그러나 수학자들은 주어진 출력에 대한 알고리즘 복잡성 (이론의 창시자 중 하나 인 Andrey Kolmogorov 이론) 이후에 알고리즘 복잡성 (Kolmogorov 복잡성이라고도 함) (이를 지정하는 데 필요한 가장 짧은 프로그램의 길이)이 계산할 수 없다는 것을 알게되었습니다. 따라서 컴퓨터 과학자들은 줄이나 다른 물체를 압축하는 이상적인 방법을 결정할 수 없었습니다.

결과적으로, 알고리즘 정보 이론은 대부분 순수한 수학의 영역으로 강등되었으며, 여기서 관련 정리를 탐색하고 무작위성과 구조의 개념을 정의하는 데 사용됩니다. 실제 용도는 손이 닿지 않는 것처럼 보였다. 이전에 IBM Thomas J. Watson Center와 리우데 자네이루 연방 대학교 (Federal University of Rio de Janeiro)의 유명한 수학자 그레고리 차이틴 (Gregory Chaitin)은“수학적으로, 그것은 단순하고 아름다운 복잡성의 척도”라고 말했다. "그러나 실제 응용 프로그램에는 접근 할 수없는 것처럼 보였습니다."

그것은 그를 시도하는 것을 막지 못했습니다. 그는 이론이 DNA가 소프트웨어 역할을한다는 생각을 공식화하는 데 사용될 수 있기를 바랐다. 2012 년에 그는 어떻게 진화가 소프트웨어 공간을 통해 무작위로 걸어 갈 수 있는지 설명하는 책을 출판했습니다. 그는 그 산책을 따른 돌연변이는 통계적으로 무작위 확률 분포를 따르지 않는다고 주장했다. 대신, 그들은 Kolmogorov 복잡성을 기반으로 분포를 따릅니다. 그러나 그는 그것을 테스트 할 방법이 없었습니다.

이제 일부 과학자들은 생물학과 컴퓨터 과학 분야와 관련이 있도록 그 맥락에서 이론을 되살리기를 바라고 있습니다.

단순성에 대한 편향

스웨덴의 Karolinska Institute의 컴퓨터 과학자 인 Hector Zenil은 이론을 부활시키려는 사람들 중 하나입니다. 그는 다른 연구자들과 협력하여 유전자 조절 또는 세포에서의 단백질 상호 작용을 모델링하는 것과 같은 생물학적 네트워크의 복잡성을 분석하기위한 메트릭으로 Kolmogorov 복잡성을 사용했습니다. 연구원들은 네트워크의 알고리즘 정보 내용에 근사한 다음 (실제 값을 계산할 수 없기 때문에) 네트워크에 돌연변이를 도입하고 Kolmogorov 복잡성에 미치는 영향을 테스트합니다. 그들은이 방법이 네트워크의 다양한 요소의 상대적 중요성과 네트워크가 의도적 인 변화에 기능적으로 어떻게 반응 할 수 있는지를 보여주기를 희망합니다.

예를 들어, 사전 인쇄 사이트 arxiv.org에 게시 된 최근 결과에서, 그들은 네트워크를 더 큰 Kolmogorov 복잡성으로 옮기는 것으로 네트워크의 설명 프로그램이 더 길어지는 돌연변이를 도입함으로써 시스템이 수행 할 수있는 기능의 수를 늘리는 경향이 있었고, 섭동에 더 민감하게 만들 수 있음을 발견했습니다. 그들이 더 큰 단순성을 향해 네트워크를 멍청이했다면, 더 적고 안정적인 기능이 등장했습니다.

그러나 Kolmogorov 복잡성이 Chaitin이 믿었던 변화의 원동력이 여전히 볼 수 있었기 때문에 도구 이상의 역할을 할 수 있는지 여부. 문제에도 불구하고 알고리즘 정보는 생물학 영역에서 약간의 호소력을 가지고 있습니다. 전통적으로, 진화 역학을 설명하는 데 사용되는 수학적 프레임 워크는 인구 유전학입니다. 유전자가 인구에서 얼마나 자주 나타날 수 있는지에 대한 통계적 모델입니다. 그러나 인구 유전학에는 한계가 있습니다. 예를 들어 생명의 기원 및 기타 주요 생물학적 전이 또는 완전히 새로운 유전자의 출현을 설명 할 수 없습니다. Chaitin은“이 사랑스러운 수학적 이론에서 잃어버린 개념은 생물학적 창의성의 개념입니다. 그러나 우리가 알고리즘 정보를 고려하면 그는“창의성은 자연스럽게 적합하다”고 말했다.

진화 과정 자체가 시간이 지남에 따라 개선되고 더욱 효율적이라는 생각도 마찬가지입니다. 영국의 Hertfordshire University의 컴퓨터 과학자이자 인공 지능 교수 인 Daniel Polani는“진화가 본질적으로 학습한다고 확신합니다. "그리고 이것이 비대칭 적으로 내려가는 알고리즘 복잡성으로 표현할 수 있다면 놀라지 않을 것입니다."

Zenil과 그의 팀은 알고리즘 복잡성 프레임 워크의 생물학적 및 계산적 영향을 실험적으로 탐구하기 시작했습니다. 그들은 네트워크를 분석하고 교란시키기 위해 개발 한 것과 동일한 복잡성 근사화 기술을 사용하여, 인공 유전자 네트워크를 특정 표적으로“진화”했다. (유전자와 0의 매트릭스와 0의 상호 작용을 나타내는 것을 의미했다. 다시 말해, 그들은 더 큰 구조를 위해 선택했다.

그들은 최근 Royal Society Open Science에서보고했다 즉, 통계적으로 무작위 돌연변이와 비교하여,이 돌연변이 바이어스는 네트워크가 용액으로 상당히 빠르게 진화하게 만들었습니다. 영구적 인 일반 구조를 포함한 다른 기능도 등장했습니다. 이미 새로운 세대가 개선되지 않을 수있는 어느 정도의 단순성을 달성 한 행렬 내의 섹션. Zenil은“일부 지역은 단순히 어느 정도의 단순성을 진화했을 수 있기 때문에 돌연변이가 발생하기 쉬운 경우가 더 많았다”고 말했다. "이것은 즉시 유전자처럼 보였습니다." 그 유전자 기억은 차례로 더 큰 구조를 더 빨리 산출했습니다. 연구자들은 알고리즘 적으로 돌연변이가 다양성 폭발과 멸종으로 이어질 수 있음을 암시합니다.

Zenil은“이것은 진화에 대해 이야기 할 때 계산 과정을 고려하는 것이 유익하다는 것을 의미합니다.”라고 말했습니다. 그는 무작위성과 복잡성에 대한 이러한 이해를 사용하여 돌연변이가 발생하기 쉬운 경로를 식별하거나 특정 유전자 상호 작용이 암과 같은 질병과 관련이있을 수있는 이유를 파악하기를 희망합니다.

진화하는 소프트웨어

Zenil은 생물학적 진화가 동일한 계산 규칙에 따라 운영되는지 여부를 탐구하기를 희망하지만 대부분의 전문가들은 의심을 가지고 있습니다. 알고리즘의 복잡성을 근사화하거나 이러한 종류의 돌연변이 편향을 효과가있는 자연 메커니즘이 어떤 자연 메커니즘을 담당 할 수 있는지는 확실하지 않습니다. 또한 프랑스 국립 과학 연구 센터 (National Center for Scientific Research)의 수학자 인 주세페 롱고 (Giuseppe Longo)는“네 글자로 완전히 인코딩 된 삶의 생각은 잘못이다. "DNA는 매우 중요하지만, 세포, 유기체, 생태계에 있지 않은 경우에는 의미가 없습니다." 다른 상호 작용이 진행 중이며이 알고리즘 정보의 적용은 그 복잡성의 정도를 포착 할 수 없습니다.

그럼에도 불구하고, 개념은 어떤 관심을 불러 일으켰습니다. 특히 진화와 계산 과정에 대한 이러한 생각의 방식이므로 유전자 프로그래밍의 진화 소프트웨어를 목표로하는 공통점이있는 것 같습니다.

실제로, Chaitin과 Kolmogorov 복잡성과 유전자 프로그래밍 방법에 대한 Zenil의 아이디어 사이의 잠재적 인 연관성에 대한 흥미로운 힌트가있었습니다. 예를 들어, 2001 년에 한 연구 팀은 유전자 프로그램의 출력의 복잡성이 원래 프로그램의 Kolmogorov 복잡성에 의해 경계를 이룰 수 있다고보고했습니다.

그러나 대부분의 경우 Kolmogorov 복잡성은 컴퓨터 과학자들의 이러한 아이디어에 대한 이해에 중요한 역할을하지 않았습니다. 대신, 그들은 관련된 유전학과 돌연변이를 수정하는 다른 방법을 시도했습니다. 일부 그룹은 돌연변이 속도를 왜곡시켰다; 다른 사람들은 더 큰 코드 덩어리를 대체하는 돌연변이를 선호하기 위해 시스템을 편향시켰다. 매사추세츠 주 햄프셔 칼리지 (Hampshire College)의 컴퓨터 과학자 인 Lee Spector는“사람들이 생각 해낸 수십, 수백 가지의 돌연변이 및 크로스 오버가 있습니다. Spector는 최근 한 유전자를 다른 유전자로 직접 대체하는 대신 유기체 게놈 전체에 돌연변이를 추가하고 삭제하는 이점을 보여주는 팀을 이끌었습니다. 이 새로운 종류의 유전자 운영자는 게놈 검색 공간을 통한 경로 수를 기하 급수적으로 확장하고 더 나은 솔루션을 이끌어 냈습니다.

즉, 많은 연구자들은 반대 방향으로 갔다가 검색 공간을 좁히면서 프로세스 속도를 높이기 위해 영리한 방법을 찾아 검색이 최적의 결과를 놓치지 않습니다. 1960 년에 Eugene Wigner가“자연 과학에서 수학의 불합리한 효과”를 지적한 것처럼, 컴퓨터 과학자들은 컴퓨터 과학자들이 더 단순하고 우아한 모델이 종종 더 일반적으로 적용 가능하고 효과적이라는 것을 발견했습니다. Spector는“그리고 문제는 우리에게 우주에 대해 깊은 것을 말하고 있습니까? 어쨌든 유용한 것 같습니까?”

그는 또한 단순성을 향한 진화 프로그램을 편향시키려는 시도도 파괴적 일 수 있다고 경고합니다. 예를 들어, 짧은 프로그램 길이와 같은 보상은 나중에 나중에 도움이되었을 수있는 추정 정크를 다듬어 프로세스에서 최적의 솔루션을 희생 할 수 있습니다. "그래서 당신은 붙어 있습니다."그가 말했다.

그러나 단순성은 여전히 무거운 목표이며 유용한 목표로 남아 있습니다. 작년에 출판 된 작업에서 Spector와 그의 동료들은 프로그램 규모를 유전자 프로그래밍 기술을 수행 한 후 프로그램의 규모를 원래 규모의 25 %로 줄인다면 새로운 데이터에서 더 나은 성능을 발휘했으며 더 넓은 범위의 일반적인 문제에 사용될 수 있음을 발견했습니다.

그것이 부분적으로 그가 알고리즘 정보 이론에서 수행되는 작업을 계속 주시하고 있지만, 그는 그것이 분야에 어떤 영향을 미칠지 정확히 보지 못했다고 말합니다.

삶의 학습

아마도 Zenil의 팀은 그 영향을 찾기위한 첫 번째 단계를 밟았지만 작업의 응용 프로그램을보다 일반적으로 현실적으로 만들려면 먼저 다른 유형의 검색 문제에 대한 방법을 테스트해야합니다.

마디슨 위스콘신 대학교 (Wisconsin)의 이론적 신경 과학자 인 라리사 알바 타키 (Larissa Albantakis)는“구조에 따라 제한하는 데있어 매우 좋은 점이있다”고 말했다. "자연은 여러 가지면에서 구성되어 있으며,이를 출발점으로 취하면 가능한 모든 균일 한 돌연변이를 시도하는 것이 어리석은 일입니다."

그녀는“우리에게 의미있는 것은 어떤 식 으로든 구성되어 있습니다.”

Spector는 Zenil의 최근 작업이 매우 구체적인 문제를 넘어서서 응용 프로그램을 가지고 있다는 것에 회의적이지만“여기의 개념 뒤에있는 정보 이론은 흥미롭고 잠재적으로 매우 중요합니다.”라고 그는 말했습니다. “다른 행성에있는 것처럼 보이기 때문에 부분적으로 흥미 롭습니다. 어쩌면 우리 지역 사회의 사람들이 알지 못하는 통찰력이있을 수 있습니다.” 결국 알고리즘 정보는 유전자 프로그래밍 전문가들이 진화의 개방형 특성을 포함하여 그들의 작업에 포함되지 않을 수 있다는 광범위한 개념을 활용합니다.

Spector는“여기에는 중요한 것들이 있다는 것이 강력합니다. 그럼에도 불구하고 그는 지금 "그들이 작업중 인 것과 실제 응용 분야 사이에는 여전히 더 큰 거리가 있습니다."

Chaitin은“진화하는 소프트웨어로서의 삶에 대한 생각은 비옥하다”고 말했다. 인공적 또는 생물학적 삶에 대해 생각하든“우리는 얼마나 멀리 떨어져 있는지 알아야합니다.”