컴퓨터 과학 교수 인 Jure Leskovec가 이끄는이 팀은 "Data Wrangler"라는 시스템을 만들었습니다. "데이터 Wrangler"라는 시스템을 만들어 RAW 데이터를보다 액세스 가능하고 사용 가능한 형식으로 자동으로 정리하고 변환 할 수 있습니다.
Leskovec은“원시 정부 데이터는 종종 지저분하고 이해하기가 어렵다. "우리의 목표는 연구, 저널리즘 또는 기타 목적에 사용하려는 사람들 이이 데이터에 더 액세스 할 수있는 도구를 만드는 것이 었습니다."
데이터 Wrangler는 다양한 기계 학습 및 자연어 처리 기술을 사용하여 데이터의 오류를 식별하고 수정하고 텍스트에서 의미있는 정보를 추출합니다.
이 시스템은 재무 기록, 범죄 통계 및 환경 데이터를 포함한 다양한 정부 데이터를 분석하는 데 사용될 수 있습니다.
Leskovec와 그의 팀은 이미 Data Wrangler를 사용하여 미국 인구 조사국의 미국 커뮤니티 조사 및 뉴욕시 경찰국의 중지 및 대단한 데이터를 포함한 여러 대형 데이터 세트를 분석했습니다.
이 분석의 결과는 여러 학술 저널에 발표되었으며 언론인과 정책 입안자들이 그들의 작업에 정보를 제공하기 위해 사용했습니다.
Leskovec은“우리는 데이터 Wrangler가 사람들이 정부 데이터를 사용하는 방식에 혁명을 일으킬 가능성이 있다고 생각한다. "이 데이터를보다 쉽게 접근하고 사용할 수있게함으로써 우리는 사람들이 자신의 삶과 지역 사회에 대한 더 나은 결정을 내릴 수 있도록 힘을 실어 줄 수 있습니다."
이 팀의 연구는 "Nature Machine Intelligence"저널에 발표되었습니다.