1. 패턴과 트렌드 :
* 관계 식별 : 다른 변수간에 상관 관계가 있습니까? 한 변수의 변경 사항은 다른 변수의 변경에 지속적으로 해당합니까?
* 특이 치 식별 : 일반적인 추세에 맞지 않는 비정상적인 데이터 포인트가 있습니까? 이것들은 오류가 될 수 있거나 추가 조사를 보장하는 흥미로운 현상을 나타낼 수 있습니다.
* 데이터 시각화 : 그래프, 차트 및 기타 시각화를 만들면 단순히 숫자를 보면 놓칠 수있는 패턴을 드러 낼 수 있습니다.
2. 통계적 유의성 :
* 확률 결정 : 관찰 된 패턴이 우연히 발생했을 가능성이 있습니까, 아니면 실제 현상입니까?
* p- 값 계산 : 이것은 실제 효과가 없으면 데이터를 관찰 할 확률을 결정하는 데 도움이됩니다. 낮은 p- 값 (일반적으로 0.05 미만)은 관찰 된 효과가 통계적으로 유의하다는 것을 나타냅니다.
* 신뢰 구간 : 이들은 실제 모집단 매개 변수가있을 가능성이있는 다양한 값을 제공합니다.
3. 가설 지원 또는 반박 :
* 데이터가 초기 가설을 지원합니까? 아니면 대체 설명을 제안합니까?
* 예상치 못한 결과가 있습니까? 이것들은 새로운 연구 질문과 탐사의 길로 이어질 수 있습니다.
* 데이터를 일반화 할 수 있습니까? 결과를 다른 인구 나 상황에 적용 할 수 있습니까?
4. 데이터 품질 :
* 정확도 : 데이터 포인트가 정확하고 신뢰할 수 있습니까? 측정이 올바르게 취해 졌습니까?
* 완전성 : 누락 된 데이터 포인트가 있습니까? 데이터에 분석에 영향을 줄 수있는 간격이 있습니까?
* 일관성 : 오류 나 편견을 제안 할 수있는 데이터에 불일치가 있습니까?
5. 강점과 한계 :
* 데이터의 강점은 무엇입니까? 데이터 소스의 주요 장점과 데이터 소스를 수집하는 데 사용되는 방법은 무엇입니까?
* 데이터의 한계는 무엇입니까? 분석에 영향을 줄 수있는 잠재적 편향 또는 오류는 무엇입니까?
6. 해석과 결론 :
* 데이터는 우리에게 무엇을 말합니까? 주요 결과와 그 의미는 무엇입니까?
* 다음 단계는 무엇입니까? 남은 질문을 해결하거나 새로운 길을 탐색하기 위해 어떤 추가 연구가 필요합니까?
데이터 분석은 반복적 인 프로세스라는 점에 유의해야합니다. 과학자들은 종종 다른 단계들 사이를왔다 갔다하여 데이터와 그 의미에 대한 더 깊은 이해를 얻음에 따라 분석을 수정합니다.