상관 계수는 두 가지가 얼마나 잘 관련되어 있는지 측정하는 것입니다. R으로 약칭 된 상관 계수는 산란 다이어그램의 데이터가 직선을 따르는지를 나타냅니다. 실제 r 값이 하나에 가까울수록 선형 방정식이 데이터를 더 잘 표현할 수 있습니다. R 값이 0에 가까운 데이터 세트에는 직선 연관성이 없습니다. 데이터 수집은 r =1 또는 r =–1 인 경우 정렬됩니다.
다음은 세 가지 다른 유형의 상관 계수입니다.
- Pearson의 상관 계수
- Spearman 's correlation
- Kendall의 관계
상관 계수를 계산하기위한 공식
다음 공식은 샘플 상관 계수를 나타내는 데 사용될 수 있습니다.
r = ∑ [( x i - x ) ( y i - y )] √σ ( x i - x ) 2 * σ ( y i - y ) 2
( x i , y i ) =한 쌍의 데이터
x/ = x 의 평균 i
s (y) =y 좌표의 두 번째 좌표의 편차 (i)
= y 의 평균 i
중요한 테이크 아웃
- 두 변수 간의 관계의 강도는 상관 계수를 사용하여 측정됩니다.
- 통계에서 상관 계수가 일반적으로 사용됩니다. 이 메트릭은 2 가지 변수 선형 관계의 방향과 강도를 평가합니다.
- 값은 항상 –1 (강한 음의 관계)과 +1 (강하게 긍정적 인 관계) 사이입니다. 값이 0에 있거나 가까이 있으면 선형 관계가 약하거나 존재하지 않습니다.
- +0.8 미만의 상관 계수 –0.8보다 큰 상관 계수.
상관 계수를 계산하기위한 단계
- 데이터 세트 목록을 작성하십시오.
계산을 시작하려면 사용할 변수의 체크리스트를 생성하십시오. 데이터 세트를 만든 후이 그림을 방정식에 연결하십시오. 이 값은 x 및 y 변수를 사용하여 분리됩니다.
-
각 X 변수에 대해 표준화 된 값을 계산하십시오.
다음 방정식을 사용하여 데이터 세트를 선택한 후 각 x (I) 변수의 표준화 된 값을 결정하십시오.
(z ( x i ) ) =( x i - x̅) / s (x)
- 각 y 변수에 대해 표준화 된 값을 계산하십시오.
각 x (i)의 표준화 된 값을 결정한 후 다음 방정식을 사용하여 각 y (i)의 표준화 된 값을 결정하십시오.
.(z ( y i )) =( y i - ȳ) / s (y)
-
곱하고 추가하여 총계를 얻습니다.
이전 단계에서 얻은 표준화 된 값을 곱하십시오. 아래에 표시된 공식을 사용하십시오.
(z ( x i )) * (z ( y i ))
숫자를 곱한 후에는 총을 얻기 위해 추가하십시오.
- 총계를 나누어 상관 계수를 계산합니다.
N을 사용하여 다음 단계 에서이 정보 쌍의 총점을 표시하십시오. 4 단계에서 얻은 결과에서 n – 1을 빼십시오.
결론
상관 계수는 두 변수 사이의 관계의 강도를 평가하는 데 사용됩니다. 상관 계수는 두 변수 간의 관계 조건과 접두사를 만듭니다. 상관 계수는 'R'로 표시됩니다. 작업중인 변수 또는 정보를 이해하여 가장 높은 상관 계수를 선택할 수 있습니다.