
사회는 개인 건강에서 세계 금융 위기, 식량 부족, 질병 발병 및 민족 폭력에 이르기까지 많은 도전에 직면 해 있습니다. 이러한 문제는 매우 복잡합니다. 우리가이를 해결하는 데 많은 어려움이있는 이유는 실제로 기본적인 수학적 문제에 뿌리를두고 있습니다. 많은 양의 데이터에서 중요한 정보 (효과적인 중재를 결정하는 정보)를 어떻게 식별 할 수 있습니까?
우리는 그 어느 때보 다 사회에 대한 더 많은 데이터를 가지고 있지만 빅 데이터에서 실행 가능한 솔루션으로의 경로는 간단하지 않습니다. 뉴 잉글랜드 단지 시스템 연구소 (New England Complex Systems Institute)의 연구를 요약 한 논문은“빅 데이터에서 중요한 정보에 이르기까지”문제가 무엇인지, 이러한 과제를 해결하는 데 실질적인 진전을 이루는 방법을 보여주는 프레임 워크를 제공합니다.
.아픈 사람이나 고군분투하는 국가의 경제를 건강이나 안정성 상태로 데려가는 과학적 궤도는 무엇입니까? 어려운 경우 올바른 접근 방식이 간단한 것 같습니다. 사용 가능한 데이터를 연구하고 모델을 구축하십시오. 모델을 시뮬레이션하고 중재의 영향을 예측합니다. 이 접근법은 합리적으로 보이지만 숨겨진 결함이 있습니다. 공부할 올바른 속성을 올바르게 식별하는 경우에만 작동합니다.
시스템에 대한 점점 더 자세한 내용을 계속 수집하면 어떨까요? 모델이 옳지 않습니까? 문제는 데이터가 끝나지 않는다는 것입니다. 작은 시스템에 대해서도 시스템에 대한 모든 미세한 정보를 얻을 수는 없습니다.
이 도전에 대한 NECSI의 솔루션은 원래 물리학, 특히 위상 전이에 대한“재정지 그룹”연구에서 개발 된 시스템을 설명하는 새로운 수학적 접근 방식에서 비롯됩니다. 물의 끓는점을 고려하십시오. 전이는 밀도의 불연속 변화를 일으킨다. 압력을 증가 시키면 끓는 온도도 증가합니다. 밀도의 불연속은 사라질 때까지 감소합니다. 이 시점에서 2 차 위상 전이 지점이라고 불리는 시스템은 밀도 변화 자체에 의해 설명 할 수없는 동작을 가지고 있습니다. 대신, 재료 전체에 밀도의 변동이 있습니다. 이러한 수학적으로 치료하기 위해 Ken Wilson
NECSI의 논문은 이러한 개념을 일반화 된 멀티 스케일 정보 이론으로 확장합니다. 이 접근법에서 데이터 또는 정보 자체는 특정 척도가 제공됩니다. 복잡한 시스템의 다른 속성은 다른 규모로 동작에 영향을 미칩니다. 실제 시스템의 동작을 바꾸고 싶을 때, 우리는 일반적으로 가장 큰 규모에 영향을 미치기를 원합니다. 우리 모델에 가장 중요한 속성은 가장 큰 규모로 볼 수있는 속성이 될 것입니다.
이 접근법은 엄청난 단순화입니다. 분자 스케일 업에서 시스템의 행동에 영향을 미치는 모든 데이터와 모든 원인과 결과의 사슬을 연구하는 대신 중요한 정보에만 초점을 맞출 수 있습니다. 그럼에도 불구 하고이 접근법은 실제로 구현하기가 어려울 수있는 자체 수학적 치료가 필요합니다. 그러나 노력이 이루어지면 멀티 스케일
NECSI는 이러한 방법을 여러 가지 실제 문제에 성공적으로 적용했습니다. 분석에 따르면 아랍 봄은 식량 가격 상승으로 인해 침전되었음을 보여주었습니다. 이 가격은 옥수수가 미국의 에탄올 및 농업 시장 추측으로 전환되어 차례로 증가했습니다. 또 다른 분석은 많은 국가에서 폭력의 가장 큰 예측자는 민족 집단의 지리적 분포입니다.
우리는 서 아프리카 발발 전에 에볼라가 크게 더 큰 발발이있을 것이라고 올바르게 예측했습니다. 그런 다음 방문 도어 건강 검진이 바이러스가 확산되는 것을 빠르게 막을 것이라고 올바르게 예측했습니다. 이러한 모든 경우에, 우리의 접근 방식은 사회의 가장 큰 과제를 해결하기위한 가장 중요한 속성과 수단을 찾기 위해 복잡한 원인과 효과의 웹을 풀어주었습니다.
빅 데이터에서 중요한 정보에 이르기 까지이 연구는 최근 Yaneer Bar-Yam이 저널 complexity 에 발표했습니다. .