인간이나 인간 팀은 오늘날의 많은 물리학 및 천문학 실험에서 생성 한 정보의 눈사태를 따라갈 수 없었습니다. 그들 중 일부는 매일 테라 바이트의 데이터를 기록합니다. 토렌트는 증가하고 있습니다. 2020 년대 중반에 전환 할 예정인 무선 망원경 인 제곱 킬로미터 어레이는 인터넷 전체만큼 매년 거의 많은 데이터 트래픽을 생성 할 것입니다.
대홍수에는 많은 과학자들이 도움을 요청하기 위해 인공 지능을 바꾸고 있습니다. 인공 신경망과 같은 AI 시스템 (뇌의 기능을 모방하는 컴퓨터-시뮬레이션 뉴런 네트워크)과 같은 AI 시스템은 데이터 산을 통해 쟁기질을하고 인간이 결코 발견 할 수없는 패턴을 감지 할 수 있습니다.
.물론, 과학적 연구를 돕기 위해 컴퓨터를 사용하는 것은 약 75 년 전으로 거슬러 올라가며, 의미있는 패턴을 찾기 위해 데이터를 수동으로 포기하는 방법은 천년 더 일찍 시작되었습니다. 그러나 일부 과학자들은 머신 러닝과 AI의 최신 기술이 근본적으로 새로운 과학을 수행하는 방법을 대표한다고 주장하고 있습니다. 생성 모델링으로 알려진 이러한 접근법 중 하나는 데이터만을 기반으로 관찰 데이터에 대한 경쟁 설명 중에서 가장 그럴듯한 이론을 식별하는 데 도움이 될 수 있으며, 중요한 것은 연구중인 시스템에서 어떤 물리적 프로세스가 작동 할 수 있는지에 대한 전립선 지식 없이는 중요합니다. 생성 모델링의 지지자들은 그것을 우주에 대한 학습의 잠재적 인 "세 번째 방법"으로 간주 될 정도로 참신한 것으로 간주합니다.
전통적으로, 우리는 관찰을 통해 자연에 대해 배웠습니다. Tycho Brahe의 행성 위치 테이블에 대한 Johannes Kepler Poring을 생각하고 기본 패턴을 분별하려고 생각하십시오. (그는 결국 행성이 타원형 궤도로 움직이는 것을 추론했다.) 과학은 또한 시뮬레이션을 통해 발전했다. 천문학자는 은하수와 인근 은하 인 안드로메다의 움직임을 모델링하고 수십억 년 안에 충돌 할 것으로 예측할 수 있습니다. 관찰과 시뮬레이션은 과학자들이 가설을 생성하여 추가 관찰로 테스트 할 수 있도록 도와줍니다. 생성 모델링은이 두 가지 접근법과 다릅니다.
천체 물리학 자이자 가장 열렬한 지지자 중 한 명인 Kevin Schawinski는“기본적으로 관찰과 시뮬레이션 사이의 세 번째 접근법”이라고 말합니다. "문제를 공격하는 다른 방법입니다."
일부 과학자들은 생성 모델링 및 기타 새로운 기술을 단순히 전통적인 과학을위한 전동 공구로 본다. 그러나 대부분 AI는 엄청난 영향을 미치고 있으며 과학에서의 역할 만 성장할 것이라는 데 동의합니다. 인공 신경망을 사용하여 우주를 연구하는 Fermi National Accelerator Laboratory의 천체 물리학자인 Brian Nord는 인간 과학자가 자동화 할 수없는 일이 없다고 우려하는 사람들 중 하나입니다. "이것은 약간 냉담한 생각입니다."
세대에 의한 발견
대학원 이후 Schawinski는 데이터 중심 과학 분야에서 자신의 이름을 만들고 있습니다. 박사 학위 작업을하는 동안 그는 외모에 따라 수천 개의 은하를 분류하는 임무에 직면했습니다. 그 일에 쉽게 이용 가능한 소프트웨어가 존재하지 않았기 때문에, 그는 그것을 크라우드 소스하기로 결정했습니다. 그래서 Galaxy Zoo Citizen Science 프로젝트가 탄생했습니다. 2007 년부터 일반 컴퓨터 사용자는 천문학 자들이 어떤 갤럭시가 어떤 범주에 속한 지에 대한 최고의 추측을 기록하여 천문학자를 도왔으며, 대다수의 규칙은 일반적으로 올바른 분류로 이어집니다. 이 프로젝트는 성공적 이었지만 Schawinski가 지적한 것처럼 AI는 다음과 같이 말합니다.“오늘날 기계 학습에 대한 배경 지식을 가진 재능있는 과학자와 클라우드 컴퓨팅에 대한 액세스가 오후에 모든 일을 할 수 있습니다.”
.Schawinski는 2016 년에 강력한 새로운 생성 모델링 도구로 바뀌 었습니다. 본질적으로 생성 모델링은 조건 X가 결과를 관찰 할 가능성이 얼마나 묻는지를 묻습니다. 예를 들어, 생성 모델에 인간 얼굴의 이미지 세트를 먹이고 각면에 사람의 나이가 표시되어 있다고 가정 해 봅시다. 컴퓨터 프로그램이 이러한 "훈련 데이터"를 빗질 때, 오래된 얼굴과 주름의 가능성이 높아지기 시작합니다. 결국 그것은 주어진 얼굴을“연령”할 수 있습니다. 즉, 모든 연령의 주어진 얼굴이 어떤 신체적 변화를 겪을 수 있는지 예측할 수 있습니다.
.
가장 잘 알려진 생성 모델링 시스템은 "GANS (Generative Adversarial Networks)"입니다. 훈련 데이터에 적절히 노출 된 후, GAN은 픽셀이 손상되거나 누락 된 이미지를 수리하거나 흐릿한 사진을 날카롭게 할 수 있습니다. 그들은 경쟁을 통해 누락 된 정보를 추론하는 법을 배웁니다 (따라서 "Adversarial"이라는 용어) :생성기로 알려진 네트워크의 한 부분은 가짜 데이터를 생성하는 반면, 두 번째 부분 인 판별자는 가짜 데이터를 실제 데이터와 구별하려고합니다. 프로그램이 진행됨에 따라 두 절반이 점차 좋아집니다. 당신은 최근에 순환 한 초현실적 인 가간 생산“얼굴”을 보았을 것입니다-한 헤드 라인이 말한 것처럼“실제로 존재하지 않는 현실적인 사람들”의 이미지
.보다 광범위하게, 생성 모델링은 일련의 데이터 세트 (일반적으로 이미지이지만 항상 그런 것은 아님)를 가져 와서 각각을 기본적이고 추상적 인 빌딩 블록 세트로 분해합니다. 과학자들은 이것을 데이터의 "잠재적 공간"이라고합니다. 알고리즘은 잠재 공간의 요소를 조작하여 이것이 원래 데이터에 어떤 영향을 미치는지 확인하고 시스템에서 작동하는 물리적 프로세스를 발견하는 데 도움이됩니다.
.잠재적 인 공간에 대한 아이디어는 추상적이고 시각화하기 어렵지만 거친 비유로 인간의 얼굴의 성별을 결정하려고 할 때 뇌가 무엇을 할 수 있는지 생각해보십시오. 아마도 헤어 스타일, 코 모양 등을 알 수있을 것입니다. 컴퓨터 프로그램은 마찬가지로 데이터들 사이에서 두드러진 기능을 찾고 있습니다. 콧수염이 무엇인지 또는 성별이 무엇인지, 어떤 이미지가 "남자"또는 "여자"로 표시되는 데이터 세트에 대해 훈련 된 경우, 일부 "콧수염"태그가있는 경우 연결을 빠르게 전략합니다.
.Astronomy &Astrophysics에 12 월에 출판 된 논문에서 , Schawinski와 그의 ETH Zurich 동료 인 Dennis Turp와 CE Zhang은 생성 모델링을 사용하여 은하가 진화 할 때 겪는 물리적 변화를 조사했습니다. (그들이 사용한 소프트웨어는 생성 된 적대적 네트워크가이를 취급하는 방식과 다르게 잠복 공간을 다르게 취급하므로 기술적으로 GAN이 아니지만 비슷한 것이 아닙니다.) 그들의 모델은 물리적 프로세스에 대한 가설을 테스트하는 방법으로 인공 데이터 세트를 생성했습니다. 예를 들어, 별 형성의 "켄칭"(형성 속도의 급격한 감소)이 갤럭시 환경의 밀도가 증가하는 것과 어떻게 관련이 있는지 물었다.
Schawinski의 경우 주요 질문은 스타 및 은하 프로세스에 대한 정보가 데이터만으로 얼마나 놀릴 수 있는지입니다. "천체 물리학에 대해 우리가 알고있는 모든 것을 지우겠습니다." "데이터 자체를 사용하여 그 지식을 어느 정도 재발견 할 수 있습니까?"
첫째, 갤럭시 이미지는 잠재적 인 공간으로 축소되었습니다. 그런 다음 Schawinski는 예를 들어 갤럭시 환경의 특정 변화에 해당하는 방식으로 해당 공간의 한 요소를 조정할 수 있습니다. 그런 다음 그는 은하계를 재생하고 어떤 차이가 나타 났는지 볼 수있었습니다. "그래서 이제 나는 가설 생성 기계가 있습니다."라고 그는 설명했습니다. "저는 원래 저밀도 환경에있는 은하계를 섭취 하고이 과정에서 고밀도 환경에있는 것처럼 보이게 할 수 있습니다." Schawinski, Turp 및 Zhang은 은하가 저밀도 환경에서 고밀도 환경에서 고밀도로 가면 색이 붉어지고 별이 더 중심적으로 집중되어 있음을 알았습니다. Schawinski는 이는 은하에 대한 기존의 관찰과 일치한다고 말했다. 문제는 이것이 왜 그렇게되는지입니다.
Schawinski는 다음 단계는 아직 자동화되지 않았다고 말합니다.“인간으로 들어와야하고,이 과정에 대해 어떤 종류의 물리학 이이 효과를 설명 할 수 있습니까?”라고 말합니다. 문제의 과정에 대해 두 가지 그럴듯한 설명이 있습니다. 아마도 은하는 먼지가 더 많이 포함되어 있기 때문에 고밀도 환경에서 붉어지기 때문에 붉어 질 것입니다. 생성 모델을 사용하면 두 가지 아이디어 모두 테스트에 적용 할 수 있습니다. 먼지와 별 형성 속도와 관련된 잠재적 인 공간의 요소는 은하의 색상에 어떤 영향을 미치는지 확인합니다. Schawinski는“그리고 대답은 분명합니다. 붉은 은하는“별 형성이 떨어진 곳이 아니라 먼지가 바뀌는 곳이 아닙니다. 그래서 우리는 그 설명을 선호해야합니다.”

이 접근법은 전통적인 시뮬레이션과 관련이 있지만 중요한 차이점과 관련이 있습니다. Schawinski는 시뮬레이션은“본질적으로 가정 중심”이라고 말했다. "접근 방식은‘시스템에서 볼 수있는 모든 것을 야기하는 근본적인 물리 법칙이 무엇인지 알고 있다고 생각합니다.’그래서 스타 형성을위한 레시피가 있고, 어두운 물질이 어떻게 행동하는지에 대한 레시피가 있습니다. 나는 모든 가설을 거기에 넣고 시뮬레이션을 실행하게했습니다. 그리고 나는 묻습니다. 그것은 현실처럼 보입니까?” 그는 그가 생성 모델링으로 수행 한 일은“어떤 의미에서는 시뮬레이션과 정확히 반대입니다. 우리는 아무것도 모른다. 우리는 아무것도 가정하고 싶지 않습니다. 우리는 데이터 자체가 무슨 일이 일어나고 있는지 알려주기를 원합니다.”
이와 같은 연구에서 생성 모델링의 명백한 성공은 분명히 천문학 자와 대학원생이 중복되었다는 것을 의미하지는 않지만, 천체 물리적 대상과 프로세스에 대한 학습이 전자적 손가락 끝에 거의없는 인공 시스템에 의해 달성 될 수있는 정도의 변화를 나타내는 것으로 보인다. Schawinski는“완전 자동화 과학은 아니지만 과학 과정을 자동으로 만드는 도구를 구축 할 수 있음을 보여줍니다.
생성 모델링은 분명히 강력하지만 과학에 대한 새로운 접근 방식을 진정으로 대표하는지 여부는 토론에 열려 있습니다. 뉴욕 대학교의 우주 학자 인 데이비드 호그 (David Hogg)와 플랫 아이언 연구소 ( Quanta , Simons Foundation의 자금은 인상적이지만 궁극적으로 데이터에서 패턴을 추출하는 매우 정교한 방법입니다. 이는 천문학 자들이 수세기 동안해온 일입니다. 다시 말해, 그것은 고급 형태의 관찰 플러스 분석입니다. Schawinski와 같은 Hogg 자신의 작품은 AI에 크게 의존합니다. 그는 신경망을 사용하여 스펙트럼에 따라 별을 분류하고 데이터 중심 모델을 사용하여 별의 다른 물리적 속성을 추론했습니다. 그러나 그는 그의 작품과 Schawinski의 작품을 시도하고 진실한 과학으로 본다. "나는 그것이 세 번째 방법이라고 생각하지 않습니다."라고 그는 최근에 말했다. “저는 커뮤니티로서 우리가 데이터를 사용하는 방법에 대해 훨씬 더 정교 해지고 있다고 생각합니다. 특히 데이터를 데이터와 비교하는 데 훨씬 나아지고 있습니다. 그러나 내 생각에, 내 작업은 여전히 관찰 모드에 있습니다.”
열심히 일하는 조수
개념적으로 소설이든 아니든, AI와 신경망이 현대 천문학 및 물리 연구에서 중요한 역할을 해왔다는 것은 분명합니다. 하이델베르크 이론 연구 연구소 (Heidelberg Institute for Theortical Studies)에서 물리학 자 카이 폴스터 (Kai Polsterer)는 천체 물리학을 수행하는 새로운 데이터 중심의 방법에 중점을 둔 연구원 팀인 AstroinFormatics Group을 이끌고 있습니다. 최근에 그들은 기계 학습 알고리즘을 사용하여 이전에 힘든 작업 인 Galaxy Data 세트에서 Redshift 정보를 추출했습니다.
.Polsterer는 이러한 새로운 AI 기반 시스템을“열심히 일하는 조수”로보고있는“열심히 일하는 조수”라고 생각합니다. 이 시스템은 모든 지루한 일을 할 수 있다고 그는 말했다.
그러나 그들은 완벽하지 않습니다. 특히 Polsterer는 알고리즘이 훈련을받은 일만 할 수 있습니다. 시스템은 입력과 관련하여 "무자비한"입니다. 갤럭시를 주면 소프트웨어는 붉은 편이와 나이를 추정 할 수 있지만 동일한 시스템에 셀카 또는 썩은 물고기의 그림을 공급하면 (매우 잘못된) 나이도 출력 할 것입니다. 결국, 인간 과학자의 감독은 여전히 필수적이라고 그는 말했다. “연구원, 당신에게 돌아옵니다. 당신은 해석을 담당하는 사람입니다.”
Fermilab의 Nord는 신경망이 결과뿐만 아니라 모든 학부생이 훈련을 받으면서 결과를 제공하는 것이 중요하다고 경고합니다. 과학에서, 당신이 측정하고 관련 오류에 대한 추정치를보고하지 않으면 아무도 결과를 진지하게 받아들이지 않을 것이라고 그는 말했다.
많은 AI 연구원들과 마찬가지로, Nord는 또한 신경망에 의해 생성 된 결과의 뚫 릴 수없는 것에 대해 우려하고 있습니다. 종종 시스템은 그 결과를 얻는 방법에 대한 명확한 그림을 제공하지 않고 답을 제공합니다.
그러나 모든 사람이 투명성 부족이 반드시 문제라고 생각하는 것은 아닙니다. 프랑스 Cea Saclay의 이론 물리학 연구소의 연구원 인 Lenka Zdeborová는 인간의 직관이 종종 똑같이 뚫을 수 없다고 지적합니다. 그녀는 사진을보고 고양이를 즉시 인식합니다.“그러나 당신은 당신이 어떻게 알고 있는지 모릅니다.”라고 그녀는 말했습니다. "당신의 뇌는 어떤 의미에서 블랙 박스입니다."
AI- 연료 데이터 중심의 과학으로 이주하는 것은 천체 물리학 자와 우주 학자 일뿐 만 아니라. 양자 물리학 자들은 이론 물리학 주변 연구소의 로저 멜코 (Roger Melko)와 온타리오 주 워털루 대학교 (University of Waterloo University of Waterloo)와 같은 신경망을 사용하여 많은 입자 체계를 설명하는 수학적 "파동 함수"를 나타내는 방법과 같은 그 분야에서 가장 힘든 가장 중요한 문제를 해결했습니다. AI는 Melko가 "차원의 지수 저주"라고 부르는 것이 필수적입니다. 즉, 파동 함수의 형태의 가능성은 설명하는 시스템의 입자 수와 함께 기하 급수적으로 증가합니다. 난이도는 체스 나 이동과 같은 게임에서 가장 좋은 움직임을 해결하려고 시도하는 것과 비슷합니다. 다음 움직임을 미리 들려, 상대방이 무엇을 할 것인지 상상하고 최상의 응답을 선택하지만 각 움직임마다 가능성의 수가 확산됩니다.
.물론 AI 시스템은 Alphago라는 AI 시스템이 최고의 인간 플레이어를 물리 쳤을 때 2016 년에 Chess와 Go Go 2016 년 에이 두 게임을 모두 마스터했습니다. Melko는 양자 물리학의 문제에 비슷하다고 말합니다.
기계의 마음
Schawinski가 과학을 수행하는“세 번째 방법”을 찾았다 고 주장하는데, Hogg가 말했듯이,“스테로이드에 대한 전통적인 관찰 및 데이터 분석 일 뿐이라고 AI는 과학적 발견의 풍미를 바꾸고 있다는 것이 분명합니다. AI 혁명은 과학에서 얼마나 멀리 갈 것인가?
때때로,“로보 과학자”의 업적에 관한 그랜드 주장이 이루어집니다. 10 년 전, Adam이라는 AI 로봇 화학자는 Baker의 효모 게놈을 조사하고 특정 아미노산을 만드는 유전자를 해결했습니다. (Adam은 특정 유전자가 누락 된 효모의 균주를 관찰하고 결과를 유전자가있는 균주의 거동과 비교함으로써이를 수행했습니다.) 유선 “로봇이 과학적 발견 자체로 만듭니다.”의 헤드 라인을 읽었습니다.
보다 최근에, 글래스고 대학교의 화학자 인 Lee Cronin은 로봇을 사용하여 화학 물질을 무작위로 혼합하여 어떤 종류의 새로운 화합물이 형성되는지 확인했습니다. 질량 분석기, 핵 자기 공명 기계 및 적외선 분광계로 실시간 반응을 모니터링하면서 시스템은 결국 어떤 조합이 가장 반응성인지 예측하는 것을 배웠습니다. Cronin은 그것이 더 많은 발견으로 이어지지 않더라도 화학자들은 약 90 %의 연구 속도를 높일 수 있다고 말했다.
작년에 ETH 취리히의 또 다른 과학자 팀은 신경망을 사용하여 데이터 세트에서 물리 법칙을 추론했습니다. 일종의 로보 키플러 (Robo-Kepler)는 지구에서 볼 수 있듯이 태양과 화성의 위치 기록에서 태양계의 헬리오 센 트릭 모델을 재발견하고, 충돌 공을 관찰함으로써 운동량 보존 법칙을 알아 냈습니다. 물리 법칙은 종종 여러 가지 방식으로 표현 될 수 있기 때문에 연구자들은 시스템이 알려진 법에 대해 생각하는 새로운 방법 (아마도 더 간단한 방법)을 제공 할 수 있는지 궁금해합니다.
이것들은 과학적 발견의 과정을 시작하는 AI의 예이지만, 모든 경우에 우리는 새로운 접근 방식이 얼마나 혁명적인지에 대해 토론 할 수 있습니다. 아마도 가장 논란의 여지가있는 것은 데이터만으로 얼마나 많은 정보를 얻을 수 있는지에 대한 질문 일 것입니다. 이는 엄청나게 큰 (그리고 성장하는) 더미의 시대에 긴급한 질문입니다. 왜 의 책에서 (2018), 컴퓨터 과학자 Judea Pearl과 과학 작가 Dana Mackenzie는 데이터가“심오한 바보”라고 주장합니다. 인과 관계에 대한 질문은“데이터만으로는 결코 대답 할 수 없습니다”라고 썼습니다. "언제든지 모델이없는 방식으로 데이터를 분석하는 논문이나 연구가 보이면 연구의 출력이 단순히 요약되고 아마도 데이터를 해석하지 않을 것임을 확신 할 수 있습니다." Schawinski는 Pearl의 입장에 동정하지만“데이터만으로”작업한다는 아이디어를“약간의 밀짚 맨”이라고 설명했습니다. 그는 그런 식으로 원인과 결과를 추론하지 않는다고 주장한 적이 없다고 그는 말했다. "나는 단지 우리가 종종 종종 데이터보다 더 많은 것을 할 수 있다고 말하고 있습니다."
또 다른 종종 듣는 논쟁은 과학이 창의성을 요구한다는 것입니다. 그리고 적어도 지금까지 우리는 그것을 기계로 프로그래밍하는 방법을 전혀 모른다는 것입니다. (크로닌의 로보-셰메이스트와 같은 모든 것을 시도하는 것은 특히 창의적 인 것처럼 보이지 않습니다.)“추론과 함께 이론을 제시하면 창의성이 필요하다고 생각합니다.”라고 Polsterer는 말했습니다. "창의력이 필요할 때마다 인간이 필요합니다." 그리고 창의성은 어디에서 왔습니까? Polsterer는 그것이 지루함과 관련이 있다고 의심합니다. 그는 기계가 경험할 수 없다고 말합니다. “창의력을 발휘하려면 지루함을 싫어해야합니다. 그리고 컴퓨터가 지루하다고 느낄 것이라고 생각하지 않습니다.” 반면에“창의적”과“영감”과 같은 단어는 종종 Deep Blue 및 Alphago와 같은 프로그램을 설명하는 데 사용되었습니다. 그리고 기계의“마음”내부에서 일어나는 일을 설명하려는 투쟁은 우리 자신의 사고 과정을 조사하는 데 어려움이 있기 때문에 반영됩니다.
Schawinski는 최근 민간 부문의 학계를 떠났습니다. 그는 현재 많은 ETH 과학자들을 고용하는 모듈 로스 (Modulos)라는 신생 기업을 운영하고 있으며, 웹 사이트에 따르면“AI와 기계 학습의 발전의 폭풍의 눈에서”일합니다. 현재 AI 기술과 본격적인 인공적인 마음 사이에 장애물이 무엇이든간에, 그와 다른 전문가들은 기계가 인간 과학자들의 작업을 점점 더 많이 할 준비가되어 있다고 생각합니다. 한계가 있는지 여부는 남아 있습니다.
"가까운 미래에 살아있는 가장 밝은 인간이 생물학적 하드웨어를 사용하여 스스로 할 수 없다는 물리학이나 수학을 발견 할 수있는 기계를 만들 수 있습니까?" Schawinski는 궁금합니다. “과학의 미래는 결국 우리가 결코 도달 할 수없는 수준에서 작동하는 기계에 의해 반드시 주도 될 것인가? 모르겠습니다. 좋은 질문입니다.”
이 기사는 에 재 인쇄되었습니다 wired.com .