일반 원칙 :
* 패턴과 트렌드 : 데이터에 반복되는 패턴이나 트렌드가 있습니까? 여기에는 변수, 특이 치 또는 시간이 지남에 따라 값의 변화를 식별하는 것이 포함될 수 있습니다.
* 중요한 차이 : 그룹이나 조건 사이에 통계적으로 유의 한 차이가 있습니까? 이것은 관찰 된 차이가 우연 또는 실제 효과로 인한 것인지 확인하는 데 도움이됩니다.
* 연관성과 상관 관계 : 특정 변수가 함께 변하는 경향이 있습니까? 이것은 잠재적 인 관계와 추가 조사의 필요성을 시사합니다.
* 가설에 대한 지원 : 데이터가 과학자의 초기 가설을 지원하거나 반박합니까? 이것은 과학적 과정에서 중요한 단계입니다.
특정 요인 :
정량적 데이터 (숫자) :
* 평균, 중앙값, 모드 : 이러한 중심 경향 측정은 데이터 분포의 전반적인 그림을 제공합니다.
* 표준 편차, 분산 : 이러한 측정은 데이터의 스프레드 또는 변동성을 나타냅니다.
* 회귀 분석 : 둘 이상의 변수 사이의 관계를 식별하고 미래의 결과를 예측하는 데 사용됩니다.
* ANOVA (분산 분석) : 둘 이상의 그룹의 평균을 비교하는 데 사용됩니다.
* t- 테스트 : 두 그룹의 평균을 비교하는 데 사용됩니다.
질적 데이터 (텍스트, 이미지, 오디오) :
* 테마 및 카테고리 : 데이터 내에서 반복되는 테마 또는 범주를 식별합니다.
* 코딩 및 분석 : 데이터를 더 작은 단위로 나누고 코드를 할당하여 패턴을 식별합니다.
* 내용 분석 : 데이터 내에서 특정 단어 또는 문구의 빈도, 강도 및 컨텍스트를 검사합니다.
* 담론 분석 : 기본 의미와 전력 구조를 이해하는 데 사용되는 언어를 분석합니다.
혼합 방법 데이터 :
* 삼각 측량 : 다른 유형의 데이터를 결합하여보다 포괄적 인 이해를 얻습니다.
* 통합 : 정량적 및 질적 분석의 결과를 결합하여 더 풍부한 그림을 제공합니다.
또한 과학자들은 다음을 찾습니다.
* 데이터 품질 : 데이터가 신뢰할 수 있고 정확합니까? 여기에는 데이터 수집 방법 및 잠재적 오류 소스를 평가하는 것이 포함됩니다.
* 데이터 해석 : 데이터는 연구 질문 및 기존 지식과 어떤 관련이 있습니까? 여기에는 결론을 도출하고 분석을 바탕으로 추론하는 것이 포함됩니다.
* 데이터 제한 : 데이터의 한계와 해석에 어떤 영향을 줄 수 있는지 인식합니다.
* 향후 연구에 대한 시사점 : 데이터 분석을 기반으로 추가 조사를위한 잠재적 인 길을 식별합니다.
궁극적으로 과학자들이 데이터 분석에서 찾는 특정 요인은 데이터의 특성과 해결중인 연구 질문에 크게 의존합니다. 그러나 근본적인 목표는 의미있는 통찰력을 추출하고 세상에 대한 우리의 이해를 발전시키는 유효한 결론을 도출하는 것입니다.