>> HLK 자연과학 >  >> 생물학

게임 이론은 협력을 의문으로 부릅니다


원고가 그의 책상을 건너 렸을 때, 펜실베이니아 대학교의 이론 생물학자인 Joshua Plotkin은 즉시 흥미를 느꼈습니다. 물리학 자 프리먼 다이슨 (Freeman Dyson)과 컴퓨터 과학자 윌리엄 프레스 (William Press)는 모두 자신의 분야에서 고도로 성취 된 유명한 수십 년 전의 게임 이론 시나리오에 대한 새로운 해결책을 찾았으며,이 시나리오는 파트너와의 속임수 또는 협력 여부를 결정해야합니다. 죄수의 딜레마는 오랫동안 협력이 자연에서 어떻게 지속될 수 있는지 설명하는 데 사용되어 왔습니다. 결국, 자연 선택은 적합성의 생존에 의해 지배되므로 개인에게 도움이되는 이기적인 전략이 지속 가능성이 높을 것으로 기대할 수 있습니다. 그러나 죄수의 딜레마에 대한주의 깊은 연구는 유기체가 전적으로 자기 이익으로 행동하고 여전히 협력적인 공동체를 만들 수 있음을 보여 주었다.

그러나이 문제에 대한 다이슨의 새로운 해결책은 그 장미 빛의 관점을 의문을 제기했다. 그것은 최고의 전략이 협력이 아니라 강탈로 이어진 이기적인 전략이라고 제안했다.

Plotkin은 우아함에서 듀오의 수학이 주목할만한 것을 발견했습니다. 그러나 결과는 그를 괴롭 혔습니다. 자연에는 협력적인 행동의 다양한 예가 포함됩니다. 예를 들어, 뱀파이어 박쥐는 먹이를 찾지 못하는 지역 사회 구성원에게 혈액 식사를 기증합니다. 일부 종의 조류와 사회 곤충은 일상적으로 다른 사람의 새끼를 키우는 데 도움이됩니다. 박테리아조차도 서로를 고수하여 일부는 독에서 살아남을 수 있습니다. 강탈이 지배한다면, 이들과 다른 이타적인 행동을 주도하는 것은 무엇입니까?

Press and Dyson의 논문은 고전적인 게임 이론 시나리오를 보았습니다. 한 쌍의 플레이어는 반복적 인 대립에 종사했습니다. Plotkin은 동일한 수학이 자연과 더 유사한 상황에 적용되면 관대함이 부활 할 수 있는지 알고 싶었습니다. 그래서 그는 인구에서 자신의 접근 방식을 재구성하여 개인이 그룹의 다른 모든 멤버와 일련의 게임을 할 수 있도록합니다. 그의 실험의 결과, 가장 최근의 결과는 12 월에 국립 과학 아카데미의 절차에서 발표되었습니다. , 관대함과 이기심이 불안정한 선을 걷도록 제안합니다. 어떤 경우에는 협력이 승리합니다. 그러나 하나의 변수 만 이동하면 강탈은 다시 한 번 인수됩니다. "우리는 이제 집단에서 진화 할 것으로 예상되거나 예상되지 않을 때 매우 일반적인 설명을 가지고 있습니다."

이 시점에서 작업은 전적으로 이론적입니다. 그러나 그 결과는 복잡한 유기체 간의 협력에서부터 다세포의 진화에 이르기까지 다양한 영향을 미치는 광범위한 영향을 미칠 수 있습니다.

.

Plotkin과 다른 사람들은 Press와 Dyson의 연구가 게임 이론을 사용하여 협력의 진화를 연구하기위한 새로운 프레임 워크를 제공 할 수 있으며, 연구자들은 협력이 존재하도록하는 매개 변수를 애타게 할 수 있다고 말합니다. 하버드 대학교의 생물 학자이자 수학자 인 마틴 노박 (Martin Nowak)은“기본적 으로이 분야를 부활시켰다”고 말했다.

tat

Vervet 원숭이는 알람 통화로 유명합니다. 원숭이는 포식자가 근처에있을 때 이웃에게 경고하기 위해 비명을 지 릅니다. 그러나 그렇게함으로써 그것은 그 자체에 위험한 관심을 끌고 있습니다. 다윈으로 돌아가는 과학자들은 이런 종류의 이타 적 행동이 어떻게 진화했는지 설명하기 위해 고군분투했습니다. 포식자에 의해 충분한 비율의 비명 원숭이가 뽑히면 자연 선택은 유전자 풀의 비명을 빼앗아 갈 것으로 예상됩니다. 그럼에도

연구원들은 협력을 설명하기위한 다른 가능한 메커니즘을 제안했습니다. 친족 선택은 가족 구성원이 궁극적으로 개인을 돕는 것을 돕는다 고 제안합니다. 그룹 선택은 협력 단체가 비협조적인 그룹보다 생존 할 가능성이 높다고 제안합니다. 직접적인 상호성은 개인이 과거에 자신을 도와 준 사람을 돕는 데 도움이되는 이점을 얻는다.

.

죄수의 딜레마는 연구원들이 관대 한 지역 사회 구성원들과 협력하고 사기꾼을 속이는 것과 같은 간단한 전략을 이해하도록 돕고 올바른 조건 하에서 협력 사회를 만들 수 있습니다. 1950 년대에 처음 설명 된 고전적인 죄수의 딜레마에는 체포되어 별도의 방에 배치 된 한 쌍의 중범 죄가 포함됩니다. 각각은 선택이 주어집니다 :고백하거나 침묵을 유지하십시오. 최상의 결과에서, 둘 다 아무 말도하지 않고 자유 로워집니다. 그러나 다른 사람이 무엇을할지 알지 못하기 때문에 조용히하는 것은 위험합니다. 하나의 스니치와 다른 하나가 침묵을 유지하면 쥐는 더 가벼운 문장을 얻는 동안 조용한 파트너가 고통을 겪습니다.

미생물과 같은 단순한 유기체조차도 이러한 유형의 게임에 참여합니다. 일부 해양 미생물은 중요한 영양소 인 철을 모으는 데 도움이되는 분자를 생성합니다. 미생물 식민지에는 종종 생산자와 사기꾼이 있습니다. 화합물을 스스로 만들지 않고 이웃의 분자를 이용하는 미생물.

죄수의 딜레마의 단일 사례에서 가장 좋은 전략은 결함이있는 것입니다. 파트너에게 삐걱 거리는 경우 시간이 줄어 듭니다. 그러나 게임이 계속 반복되면 최적의 전략이 변경됩니다. 한 번의 만남에서, 포식자를 발견하는 Vervet 원숭이는 침묵을 유지하면 더 안전합니다. 그러나 평생 동안 원숭이는 이웃에게 임박한 위험을 경고하고 같은 일을한다면 살아남을 가능성이 높습니다. Plotkin은“각 플레이어는 결함에 대한 인센티브를 가지고 있지만 전반적으로 협력하면 더 잘할 것입니다. "이것은 협력이 어떻게 나타날 수 있는지에 대한 고전적인 문제입니다."

1970 년대 미시간 대학교의 정치 과학자 인 로버트 악셀로드 (Robert Axelrod)는 서로 다른 전략을 가로 지르는 라운드 로빈 토너먼트를 시작했습니다. 많은 경쟁자들에게 놀랍게도 가장 간단한 접근 방식이 이겼습니다. 다른 플레이어의 이전 움직임을 모방 한 Tat에 대한 Tit이라고 불리는 전략은 훨씬 더 정교한 프로그램을 승리로 삼았습니다.

TIT-FOR-TAT 전략은 생물학적 세계 전역에서 찾을 수 있습니다. 예를 들어, 스티클 백 피쉬 쌍, 예를 들어, 일종의 Tit-for-Tat 듀엣에있는 스카우트 근처의 포식자. 한 물고기가 다트를 앞두고 위험한 움직임을 일으킨다면, 다른 물고기는 비슷한 용기와 비슷한 행동을합니다. 파트너가 위험을 감수하기를 희망하면서 파트너도 뒤로 물러서면 파트너도 떨어집니다.

지난 30 년 동안 과학자들은 Axelrod의 간단한 버전보다 더 진화 적으로 현실적인 포로의 딜레마를 탐구했습니다. 대형 라운드 로빈 토너먼트의 플레이어는 다양한 전략 세트로 시작합니다.이를 유 전적으로 결정된 체력으로 생각합니다. 적합한 생존을 모방하기 위해, 각 상호 작용의 승자는 더 많은 자손을 낳아 부모와 동일한 전략을 상속받습니다. 따라서 가장 성공적인 전략은 시간이 지남에 따라 인기가 높아집니다.

우승 접근법은 그룹의 규모, 시작시 전략이있는 그룹의 규모, 플레이어가 실수를하는 빈도를 포함한 다양한 요소에 달려 있습니다. 실제로, 유전자 돌연변이의 스탠드 인 역할을하는 전략의 무작위 변화 인 게임에 소음을 추가하는 것은 TAT에 대한 가슴의 통치를 끝냅니다. 이러한 상황에서 TAT의 관대 한 가슴으로 알려진 변형은 때때로 다른 사람의 배신, 승리를 용서하는 것과 관련이 있습니다.

이러한 시뮬레이션의 전반적인 맛은 낙관적입니다 - 친절은 지불합니다. Nowak은“가장 성공적인 전략은 종종 다른 사람을 이용하려고하지 않는 전략이되는 경향이 있습니다.

어두운 복용량의 절망으로 Press and Dyson을 입력하십시오.

협력자의 승리

그들의 인상적인 이력서에도 불구하고, 언론과 다이슨은 모두 게임 이론의 상대적인 신규 이민자였습니다. 이로 인해 National Academy of Sciences 의 절차에 발표 된 60 세의 죄수의 딜레마에 대한 새로운 해결책 2012 년에는 더 예상치 못한 것입니다. Plotkin은“30 년 전에 잘 쓰여질 수있는 놀라운 논문입니다. "게임 이론과 그 응용을 연구하는 수백 명의 과학자들이 있음에도 불구하고 그들의 논문의 핵심에 대한 수학적 아이디어는 간과되었습니다."

.

Press and Dyson은 강탈이라고 불리는 접근 방식을 설명했습니다. 여기에서 한 명의 플레이어는 규정 된 확률 세트에 따라 결함을 선택함으로써 항상 이길 수있었습니다. Press and Dyson의 전략은 한 선수가 게임 결과를 제어 할 수 있다는 점에서 놀랍습니다. 하버드의 Nowak 그룹의 연구원 인 Christian Hilbe는“주요 혁신은 공동 플레이어를 완전히 동기 부여하지 않고 얼마나 자주 결함이있을 수 있는지 계산하는 것입니다. 또한, 우승 한 선수는 이전의 한 가지 움직임만을 기억하면되지만 전략은 이전의 많은 라운드를 포함하는 전략뿐만 아니라 작동합니다.

.

두 번째 선수는 최고의 보상을 제공하는 옵션이기 때문에 강탈자와 협력해야합니다. Plotkin은“강탈자라면, 가끔 우리가 협력했지만 결함이있을 것입니다. 당신이 무엇을하든 당신보다 더 높은 보상을받을 것입니다. 상황은 중학교의 그룹 프로젝트를 연상시킵니다. 팀의 한 구성원이 느슨해지면 양심적 인 학생들은 좋은 성적을 얻기 위해 열심히 일할 수밖에 없습니다.

Press and Dyson의 원래 논문은 고전적인 게임 이론 컨텍스트 (한 쌍의 플레이어 간의 일련의 상호 작용)에 설정되었습니다. 그러나 Plotkin과 Stewart는 개별 체력에 따라 번식하고 생존하는 Vervet 원숭이 또는 뱀파이어 박쥐와 같은 진화하는 그룹에 동일한 수학적 접근을 적용하면 어떻게 될지 알고 싶어했습니다. 그들은 언론과 다이슨이 확인한 제로 결정 전략이라고 불리는 더 넓은 클래스의 성공적인 전략을 탐구했습니다.

이 클래스의 전략에는 강탈과 반대되는 도덕적 반대, 관대함이 포함됩니다. 일반적으로 관대 한 전략을 사용하는 플레이어는 상대방이 할 때 항상 협력 할 것입니다. 상대방 결함이있는 경우, 첫 번째 플레이어는 상대방을 관대함으로 다시 동축하려는 시도로 여전히 특정 확률과 협력합니다.

Plotkin과 Stewart의 구호를 위해, 진화하는 인구에 적용될 때 신비한 전략보다는 관대 한 전략이 가장 성공적이었습니다. 2013 년 국립 과학 아카데미 (National Academy of Sciences)의 절차에서 결과를 발표 한 Plotkin은 말했다. . "다른 전략으로 대체 할 수없는 가장 강력한 전략은 관대합니다."

.

기본 직관은 간단합니다. Plotkin은“강탈은 한 상대와 잘 어울립니다. "그러나 많은 인구에서 강탈자는 결국 다른 강탈자와 짝을 이룰 것입니다." 그러면 둘 다 결함이있어 보상이 나빠질 것입니다. Dyson은“Plotkin은 모델을 거꾸로 뒤집어 모델을 개선했습니다. "누군가가 당신과 협력하기를 원한다면, 단거리 혜택을 가진 사람을 즉시 처벌하는 것보다 뇌물을받는 것이 좋습니다."

.

Hilbe는 실제 시나리오에서 이러한 결과를 확인하여 관대 한 전략 또는 강탈자 전략을 사용하여 컴퓨터에 대한 인간 플레이어를 밟았습니다. 예측 한 바와 같이, 사람들은 이기적인 컴퓨터보다 관대 한 컴퓨터에 대항 할 때 더 큰 지불금을 받았습니다. 그러나 사람들은 또한 강탈 주의적 반대자들을 처벌하는 경향이 있었고, 그렇게하는 것이 최선의 이익이 되더라도 협력을 거부했다. 그로 인해 인간 플레이어와 컴퓨터 모두에 대한 보상이 줄었습니다. 결국, 관대 한 컴퓨터는 강탈자 컴퓨터보다 더 큰 지불금을 받았습니다.

강탈자의 복수

이러한 결과를 감안할 때 Plotkin은 강탈자들이 막을 수 있기를 희망했습니다. 그러나 그 낙관론은 수명이 짧았습니다. 그의 2013 년 연구에 이어 Plotkin은 협력하거나 결함으로 이길 수 있도록 보상을 변경했습니다. 플레이어는 전략과 전략적 보상을 자손에게 전달했습니다. 두 양은 무작위 돌연변이를 겪을 수 있습니다.

환경 조건의 변화에 ​​해당 할 수있는 시스템으로의 흔들림으로 인해 결과는 어두운면으로 돌아 왔습니다. 관대함은 더 이상 선호하는 솔루션이 아니었다. Plotkin은“그룹을 통해 결함이있는 유혹을 증가시키는 돌연변이로 인구는 티핑 포인트에 도달합니다. "결함에 대한 유혹은 압도적이며, 탈북은 그 날을 지배합니다."

.

Plotkin은 결과가 예상치 못한 것이라고 말했다. "사람들이 협력을 설명하는 데 사용한 것과 같은 프레임 워크 (게임 이론) 내에 있기 때문에 놀랍습니다." "게임이 진화하도록 허용하더라도 협력은 여전히 ​​우세 할 것이라고 생각했습니다."

.

테이크 아웃은 조건에 대한 작은 조정이 협력 또는 강탈 승리 여부에 큰 영향을 줄 수 있다는 것입니다. 이 연구에 관여하지 않은 매사추세츠 기술 연구소 (Massachusetts Institute of Technology)의 생물 물리학자인 제프 고어 (Jeff Gore)는“이것이 질적으로 다른 결과로 이어진다는 것을 알게되어 매우 깔끔합니다. "제약 조건에 따라 질적으로 다른 종류의 게임을 발전시킬 수 있습니다."

.

미시간 주립 대학의 계산 생물 학자 인 크리스 아 다미 (Chris Adami)는 최적의 전략과 같은 것이 없다고 주장합니다. 승자는 조건에 달려 있습니다.

실제로 Plotkin의 연구는 이야기의 끝이 아닐 것입니다. Hilbe는“결과가 가정에 어떻게 의존하는지 살펴 보는 사람들이있을 것이라고 확신합니다. "아마도 협력은 어떻게 든 구출 될 수 있습니다."

죄수의 미래

죄수의 딜레마는 분명히 매우 단순화 된 실제 상호 작용 버전입니다.

그렇다면 협력의 진화를 연구하기위한 모델은 얼마나 좋은가? 다이슨은 낙관적이지 않습니다. 그는 Plotkin과 Hilbe의 연구를 좋아하지만 대부분 흥미로운 수학을 포함하기 때문입니다. Dyson은“가능한 세계에 대한 설명으로서 그것은 매우 흥미롭지 만 생물학의 세계처럼 보이지는 않습니다.

Press 및 Dyson과 유사한 전략을 탐색 한 수학자 인 Ethan Akin은 그 결과가 협력의 진화보다 사회 학적 의사 결정에 더 적용 할 수 있다고 생각합니다.

그러나 일부 실험 생물 학자들은 죄수의 딜레마와 게임 이론이 더 광범위하게 그들의 분야에 중대한 영향을 미쳤다고 말합니다. 조지아 기술 연구소 (Georgia Institute of Technology)의 진화 생물 학자 인 윌 래 클리프 (Will Ratcliff)는“미생물 협력에 대한 게임 이론의 기여는 거대하다고 생각한다.

예를 들어, 항생제 저항성을 연구하는 과학자들은 Snow 드리프트 게임이라는 게임 이론 시나리오를 사용하고 있으며, 이는 플레이어가 항상 협력하는 데 도움이됩니다. (눈보라가 끝난 후 아파트 건물에 갇혀 있다면 차도를 삽질하는 혜택을 누리지만 그곳에 살고 삽질하지 않는 다른 모든 사람들도 마찬가지입니다.) 일부 박테리아는 항생제 약물을 비활성화 할 수있는 효소를 생산하고 분비 할 수 있습니다. 효소는 생산 비용이 많이 들며, 더 부지런한 이웃이 생산 한 효소를 사용하여 혜택을 줄 수없는 게으른 박테리아. 엄격한 죄수의 딜레마 시나리오에서 Slackers는 결국 생산자를 죽이고 전체 인구에 해를 끼칠 것입니다. 그러나 스노 드리프트 게임에서 생산자들은 효소에 더 많이 접근하여 체력을 향상시키고 두 가지 유형의 박테리아가 공존 할 수 있습니다.

실험실의 미생물은 게임 이론 시나리오를 모방 할 수 있지만 이러한 제어 된 환경이 자연에서 일어나는 일을 정확하게 반영하는지 여부는 또 다른 이야기입니다. Ratcliff는“우리는 특정 종류의 생태학을 가정하여 게임의 역학을 설정했습니다. 그러나 이러한 매개 변수는 미생물의 정상 서식지를 반영하지 않을 수 있습니다. Ratcliff는“실험의 역학이 죄수의 딜레마 또는 다른 게임에 부합한다는 것을 보여주기 위해 반드시 이러한 메커니즘이 자연에서이를 이끌어내는 것은 아닙니다.

  1. 어떤 종류의 식물 세포가 있습니까?
  2. 인간은 왜 울고 있습니까?
  3. 상부 및 하부 호흡기의 차이
  4. 점액 생산 세포는 무엇입니까?
  5. DNA 중합 효소 1과 3의 차이
  6. Albatross는 왜 강한 바람을 선호합니까?