분산은 통계적 설명과 확률 분포에서 서로 다른 정의와 공식을 가지고 있다.
통계 설명에서 분산은 각 변수 (관찰) 와 전체 평균의 차이를 계산하는 데 사용됩니다. 평균과 편차가 0 과 평균 제곱합 편차가 샘플 크기에 의해 영향을 받는 현상을 방지하기 위해 평균 제곱합계의 평균 편차를 사용하여 변수의 변이 정도를 설명합니다.
확장 데이터 차이 계산의 예:
알려진 요소의 실제 길이는 a 이고, a 와 b 의 두 기기로 10 을 측정하고, 측정 결과 x 는 다음과 같이 좌표의 점으로 표시됩니다.
기기 측정 단위:
B 기기 측정 결과: 전체 a.
두 기기 측정 결과의 평균값은 A 이다. 그러나 위의 결과를 사용하여 두 기기의 우열을 평가하면 기기 B 의 성능이 더 좋다고 생각하는 것이 분명하다. 기기 B 의 측정 결과가 평균 부근에 집중되어 있기 때문이다.
따라서 무작위 변수가 평균에서 벗어나는 정도를 연구할 필요가 있습니다. 그렇다면 이 편차를 어떤 양으로 측정할까요? E[|X-E[X]|] 는 임의 변수와 평균 E(X) 의 편차를 쉽게 측정할 수 있습니다. 그러나 위 공식의 절대값으로 인해 조작이 불편하며 일반적으로 E[(X-E[X])2] 를 사용합니다.