
산술 평균 숫자 세트는 해당 숫자 세트의 합과 동일합니다. 예를 들어, 세트 s ={1, 3, 5, 7, 9}의 경우, S의 산술 평균은 (1+3+5+7+9)/5 =5와 같습니다.
숫자 세트의 산술 평균은 때때로 평균 이라고합니다. 그 숫자 세트의. 일반적으로 숫자 세트의 산술 평균에 대한 공식은 다음과 같습니다.
a =σs/ n
여기서 ∑s는 해당 세트의 숫자의 합이 있고 n 해당 세트의 요소 수입니다.
많은 기본 수학적 개념과 마찬가지로 인간이 산술 평균의 개념을 처음 사용하기 시작했을 때 정확히 말하기는 어렵지만, 천문학적 데이터의 관찰 오류를 줄이기위한 수단으로 고대 천문학자가 처음 개발했을 가능성이 높습니다. 산술 평균 개념의 첫 번째 공식적인 표현은 16 세기에 제공되었지만 기원전 7 세기로 거슬러 올라가는 역사적 텍스트가 제공되었습니다. 숫자 세트의 평균을 도출하는 기술을 참조하십시오.
평균, 중앙값 및 모드
산술 평균의 개념은 숫자 세트의 중앙값 및 모드의 개념과 밀접한 관련이 있습니다. 평균, 중앙값 및 모드는 모두 중심 경향의 측정으로 간주됩니다. 어떤면에서, 평균, 중간 및 모드를 데이터 세트의 정보를“요약”하고 해당 데이터 세트의“일반적인”값을 제공하는 모든 다른 방법으로 볼 수 있습니다.
.중앙값
숫자 세트의 중앙값은 해당 세트의 중간에 떨어지는 요소를 생각할 수 있습니다. 세트의 중앙값은 해당 요소보다 동일한 양의 요소를 가진 요소로 정의됩니다. 예를 들어, 세트 s ={2, 4, 6, 8, 10, 12, 14} 중간 값은 8 입니다. 8 (2, 4 및 6) 미만의 3 값이 있으므로 8 (10, 12 및 14)보다 큰 3 가지 요소가 있습니다. 결과적으로 8은 세트의 4 번째 더 크고 4 번째로 작은 요소입니다.
세트에 이상한 숫자가있는 경우, 중앙값은 숫자를 최소에서 가장 큰 것까지 배열 할 때 중간에 직접 숫자로 떨어지는 모든 것입니다. 균일 한 양의 회원이있는 세트에는 단일 중앙 값이 없습니다. 이 경우 중간 값은 일반적으로 두 개의 가장 중간 값의 평균으로 계산됩니다. 따라서 세트 S ={1, 3, 5, 7, 9, 11} 중앙값은 두 개의 중앙 값 (5+7)/2 = 6 의 평균입니다. .
모드
숫자 세트의 모드는 해당 세트에서 가장 자주 반복되는 요소에 해당합니다. 세트 S ={1, 2, 2, 3, 4, 7, 7} 모드는 2 입니다. AS 2는 세트에서 가장 반복되는 요소입니다 (3 회). 다시 말해, 세트의 모드는 세트에서 무작위로 선택하면 얻을 가능성이 가장 높은 값입니다. 세트에서 요소 값에 대한 확률 분포를 그래프로 그래프로 표시하면 모드는 해당 분포의 "피크"에 해당합니다.
숫자 세트에 하나 이상의 모드가있을 수 있습니다. 세트 S ={2, 2, 2, 4, 5, 6, 6, 6, 7, 7, 8} 두 모드는 2 및 6 입니다. 이 두 요소가 모두 가장 많이 반복합니다. 2 개의 별개의 모드를 갖는 세트를 bimodal 이라고합니다 . 2 개 이상의 별개의 모드를 가진 세트를 multimodal 이라고합니다. . 세트 s ={12, 12, 15, 23, 23, 26, 27, 28, 28}에는 3 개의 모드, 12, 23 및 28이 있으므로 멀티 모달입니다.
이 모드 정의의 결과로, 비어 있지 않은 유한 한 을 갖는 것은 불가능합니다. 모드없이 설정합니다. 모든 요소가 다른 세트에서는 언뜻보기에 모드가없는 것으로 보일 수 있습니다. 그러나 모든 요소가 구별되는 세트는 실제로 다중 모드입니다. 이것은 각 요소가 다른 세트에서 모든 입니다. 요소는 각 요소가 동일한 주파수 (즉, 한 번)로 되풀이되므로 모드입니다. 세트 s ={1, 2, 3, 4, 5, 6}에서 각 요소가 동일한 주파수로 재발하기 때문에 모든 요소는 모드입니다. 그러나 실수 세트와 같은 일부 무한 세트에는 잘 정의 된 모드가 없습니다.
또한, 모드의 개념은 비수체 적 맥락에서 의미가되는 중심 경향의 몇 가지 척도 중 하나입니다. 예를 들어, 미국 성 집합을 취할 때 "Smith"가 데이터 세트의 모드임을 알 수 있습니다. 즉, 미국 성이 세트 중에서 Smith는 가장 반복되는 이름입니다.
평균, 중앙값 및 모드 함께
이러한 모든 개념을 결합하여 일부 숫자 세트의 평균, 중앙값 및 모드를 개별적으로 제공 할 수 있습니다.
- 평균 세트는 (3+7+14+14+14+14+22+22+36+38+56+56+63)/13 = 27.62 입니다
- 중앙값 세트의 중심 값과 같습니다. 이 경우 중심 값은 22 입니다 AS 22는 7 번째로 크고 7 번째로 작은 요소입니다.
- 모드 세트 중 가장 반복되는 요소 이므로이 경우 14입니다.
따라서 세트 S ={3, 7, 14, 14, 14, 14, 22, 22 36, 38, 56, 56, 63}의 경우 평균, 중앙값, 및 모드 27.62, 22, 입니다 및 14 , 반복적으로.
다수의 데이터 세트의 경우 이러한 측정 중 다수가 일치 할 수 있습니다. 세트 s ={3, 3, 3, 3, 3, 3, 3} 평균, 중앙값 및 모드는 모두 동일한 값, 3.
입니다.예를 들어, 위의 그래프는 다양한 가우스 확률 분포를 나타내며 벨 곡선 라고도합니다. . 정규 분포는 클래스에서 임의 변수의 예상 분포를 나타냅니다. 정규 분포에서 데이터 세트의 평균, 중앙값 및 모드는 모두 동일합니다. 확률 분포의 피크와 일치하는 값. 모집단, 높이, 혈압 및 표준화 된 시험 점수의 IQ 점수 분포와 같은 많은 데이터 세트는 정규 분포의 형태를 취하여 통계 분석에 유용한 도구입니다.
평균, 중앙값 및 모드의 사용
평균, 중앙값 및 모드는 근본적인 수학적 개념이며 어떤 식 으로든 적용되지 않는 상황을 찾기가 어렵습니다.
.평균 사용
산술 평균의 가장 일반적인 사용 중 하나는 일정 기간 동안 물체의 평균 속도를 파악하는 것입니다. 시간이 지남에 따른 물체의 속도가 {3, 7, 9, 15, 18, 20} 세트라고 가정 해 봅시다. 개별 속도를 합산하고 요소 수로 나누어 그 시간에 걸쳐 물체의 평균 속도를 파악할 수 있습니다. 이 경우 평균 속도는 (3+7+9+15+18+20)/6 = 12 m/s 입니다. . 비슷한 과정을 사용하여 시간이 지남에 따라 신체의 평균 가속도를 결정할 수 있습니다. 일정 기간 동안 개별 가속도 값을 합산함으로써 해당 시간에 걸쳐 물체의 평균 가속도를 결정할 수 있습니다.
산술 평균이 사용되는 또 다른 맥락은 국가의 1 인당 국내 총생산을 계산하기위한 경제학입니다. 1 인당 GDP는 인구의 개인당 평균 경제 생산량의 척도입니다. 1 인당 GDP는 각 개인의 총 경제 생산량을 합산하고 총 개인 수로 나누어 계산됩니다. 가상의 국가에는 5 명의 개인이 있으며 각 개인의 경제적 인 생산량은 {$ 24,000, $ 36,000, $ 36,000, $ 49,000, $ 63,000}에 의해 주어집니다. 해당 인구의 1 인당 GDP는 (24,000+36,000+36,000+49,000+63,000)/5 = $ 입니다. 41,600 . 일반적으로, 1 인당 GDP에 대한 계산 된 값은 일정 기간 동안 인플레이션 또는 금전적 가치를 설명하기 위해 수정됩니다.
.중앙값의 사용
중앙값의 가장 일반적인 사용은 산술 평균이 비정상적으로 높거나 낮은 값에 의해 왜곡 될 수있는 경우 세트의 "일반적인"구성원의 특성을 결정하는 것입니다. S ={11, 13, 17, 22, 25, 92}를 가진 사람들의 세트가 있다고 가정 해 봅시다. 이 연령의 평균은 (11+13+17+22+25+92)/6 =30입니다.이 경우, 30의 평균은 92의 특이 치 값의 존재에 의해 왜곡되며, 이는 다른 값보다 훨씬 높습니다. 실제로, 한 세트의 구성원만이 30 세 이상을 가지고 있으므로 평균 30 세가 실제로 세트를 대표하는 것으로 간주해서는 안됩니다. 이 경우 해당 세트의 전형적인 구성원을 대표하는 값은 중간 값이며 (17+22)/2 = 19.5 입니다. .
중앙값이 사용되는 한 곳은 인구의 평균 소득을 계산하는 것입니다. 경제 불평등이 많은 국가에서는 다른 사람들보다 소득이 훨씬 높은 개인의 존재는 평균 계산을 왜곡시킬 수 있습니다. 이러한 종류의 경우, 평균 소득 측정은 매우 높거나 낮은 이상치 값으로 왜곡 될 수있는 평균보다는 평균적인 사람의 소득을 결정하는 더 나은 방법 일 수 있습니다.
.모드 사용
이 모드의 가장 명백한 사용은 무작위로 선택된 요소가 설정 될 수있는 세트의 어떤 구성원을 결정하는 것입니다. 모드는 세트에서 가장 자주 발생하는 요소이므로 세트의 임의의 멤버는 모드 (또는 모드) 일 가능성이 높습니다.
중앙값과 마찬가지로,이 모드는 평균이 비정상적으로 높거나 낮은 값으로 비뚤어 질 때 데이터 세트의 "일반적인"구성원을 나타내는 데 유용한 메트릭입니다. 세트 s ={2, 2, 2, 2, 2, 2, 7, 18, 29, 54}에서 평균 계산은 세트의 끝에서 더 높은 값에 의해 왜곡됩니다. 대신, 우리는 세트의 전형적인 멤버의 지표 (2 인 모드)를 취할 수 있습니다. 세트의 임의의 멤버는 그 세트의 모드 일 가능성이 가장 높습니다.