두 가지 정량적 변수 X 및 Y가 관련되는 정도는 통계에서 상관 계수 (R로 약어)에 의해 정량화됩니다. 높은 x 값이 Y의 높은 값에 연결될 때 양의 상관 관계가 존재합니다. 높은 x 값이 낮은 y 값에 연결될 때 음의 상관 관계가 나타납니다. 일반적으로 산란 플롯은 A :
를 나타낼 수 있습니다- 양의 상관 관계 (x의 높은 값은 높은 값과 관련이 있습니다)
- 음의 상관 관계 (x의 높은 값은 y의 낮은 값과 관련이 있습니다)
- 상관 관계가 없음 (x의 값은 y의 값을 전혀 예측하지 않습니다)
상관 계수 ( 'R'로 약칭)는 단위 용어로 두 변수 간의 관계를 측정하는 통계입니다. 상관 관계 조사는 긍정적 인 상관 관계, 음의 상관 관계 또는 상관 관계가없는 세 가지 결과를 얻을 수 있습니다.
- 양의 상관 관계가 강할수록 R은 +1에 가까워집니다.
- 음의 상관 관계가 강할수록 r은 -1에 가까워집니다.
피어슨 상관 계수
- 일반적으로 상관 계수 (SS)를 계산하려면 3 개의 별도의 제곱 합계가 필요합니다. 변수 X와 Y에 대한 제곱의 합 및 XY의 교차 제품의 합.
양의 상관 관계
양의 상관 관계는 두 변수가 같은 방향으로 이동하는 2 가지 변수 연관성입니다. 결과적으로, 하나의 변수가 증가하는 동안 다른 변수가 감소하거나 다른 변수가 감소함에 따라 감소 할 때.
- 높이와 체중은 긍정적 인 연관성의 예입니다.
- 키 큰 사람들은 일반적으로 무겁습니다.
음의 상관 관계
음의 상관 관계는 한 변수의 증가로 인해 다른 변수가 떨어지는 두 변수 사이의 링크입니다.
- 해발 높이와 온도는 부정적인 연관성의 예입니다.
- 산 위로 올라갈 때 더 차가워집니다 (온도 감소)
제로 상관 관계
두 변수 사이에 상관 관계가 없으면 상관 관계는 0입니다.
- 예를 들어
- 차량의 양과 지능 수준 사이에는 연관성이 없습니다.
혼란스러운 변수
변수는 다른 하나를 원인이기 때문에 관련 될 수 있지만, 혼란스러운 변수와 같은 다른 요소가 우리의 관심 변수에서 체계적인 움직임을 생성 할 수도 있습니다.
.세 번째 변수가 관련 될 수 있으므로 상관 관계가 항상 인과 관계를 나타내는 것은 아닙니다.
예를 들어 병원 환자가되는 것은 사망과 관련이 있지만, 세 번째 변수가 관련 될 수 있기 때문에 (예 :식이 요법, 운동 수준).
.상관 관계의 장점
- 상관 관계를 통해 연구원들은 실험적으로 평가하기 위해 비현실적이거나 부도덕 한 자연 발생 변수를 볼 수 있습니다. 예를 들어 흡연이 폐암을 유발하는지 확인하기위한 실험을 수행하는 것은 비 윤리적입니다.
- 상관 관계를 통해 연구원은 변수 사이에 빠르고 효율적으로 관계가 있는지 확인할 수 있습니다. 그런 다음 그래픽으로 표시 될 수 있습니다.
상관 관계의 한계
- 상관 관계는 인과성을 의미하지 않으며 그렇게 해석 될 수 없습니다. 두 변수에 상당한 상관 관계가 있더라도 하나는 다른 하나를 원인한다고 추론 할 수 없습니다.
예를 들어, 우리는 텔레비전에서의 폭력 시청과 청소년의 폭력적인 행동 사이의 연관성을 발견했다고 가정합니다. 세 번째 (외부) 요소는 폭력적인 환경에서 자라는 등 두 가지 모두를 유발할 수 있으며 TV 시청과 폭력적인 행동이 그 결과 일 수 있습니다.
- 우리는 상관 관계를 통해 제공되는 데이터를 넘어 설 수 없습니다.
예를 들어, 숙제에 소요 된 시간 (30 분에서 3 시간)과 GCSE 패스 수 (1 ~ 6) 사이에 연결이 있다고 가정했습니다. 6 시간 동안 숙제를하는 것은 12 개의 GCSE 패스가 발생한다는 결론을 내리는 것은 잘못된 일입니다.
결론
상관 관계는 단순히 두 변수 (x 또는 y) 사이의 연관성을 결정합니다. 우연히 예측되지 않는 방식으로 다양하거나 관련되거나 함께 발생하는 경향이있는 사건, 사물 또는 수학적 또는 통계적 변수 사이에 관계가 존재합니다. 수축기 (SBP)와 이완기 (DBP) 혈압 사이의 명백하고 강한 연관성은 전형적인 예 (DBP)입니다. 두 변수 모두 연속 (스케일) 변수 인 경우, 이변 량 상관 관계 (예 :수축기 및 이완기 압력)는 산점도 도표에 표시 될 수 있습니다. 기억해야 할 가장 중요한 점은 상관 관계가 항상 동일한 원인이 아니라는 것입니다. 아이스크림의 인기가 증가함에 따라 익사 사망의 수와 산불 빈도도 마찬가지입니다. 이 사건은 동시에 발생하지만 관련이 없습니다.