본문 바로가기
데이터 및 Programing/Part1. Basic Knowledge

[기본개념] 기댓값과 분산 그리고 공분산

by 깜장스 2023. 3. 1.
반응형

1. 기댓값 (Expectation Value)

 

- 어떤 확률 과정을 무한히 반복했을 때, 얻을 수 있는 값의 평균으로서 기대할 수 있는 값을 의미함.

- 사건이 발생해서 얻는 값과 그 사건이 일어날 확률의 곱을 모든 사건에 대해 합한 값.

 

- 엄밀히 보면 가중 평균이라고 볼수 있음.

 

- 기대값은 성형성을 가지며,

 

이 성됩된다.

 

(X,Y는 확률 변수이며, a는 상수)

 

2. 분산 (variance)

 

- 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 수

 

- 기댓값은 확률 변수의 위치를 나타내고 분산은 그것이 얼마나 퍼져 있는지를 나타냄.

 

- 관측 값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나누어줌.

 

(즉 편차 제곱의 평균값임, 관측값에 평균을 뺀값을 그냥 더해주면 0이 되므로 제곱해서 더해줌.)

 

3. 공분산 (Covariance)

 

- 2개의 확률 변수의 선형 관계를 나타내는 값

 

(두 변수 사이에 어떤 상관 관계가 있는지를 알 수 있음)

 

-  분산이라는 개념을 확장하여 두 개의 확률 변수의 흩어진 정도를 공분산이라고 하는 것

 

- X의 편차와 Y의 편차의 곱의 기댓값을 의미함.

 

① 공분산이 0보다 크다 = 확률변수 X의 값이 커질 때, Y의 값도 커지는 경향이 있음을 의미

 

② 공분산이 0보다 크다 = 확률변수 X의 값이 커질 때, Y의 값도 작아지는 경향이 있음을 의미

 

③ 공분산 = 0 이면 두 변수 사이에는 아무런 상관 관계가 없다는 것을 의미.

 

공분산은 아래와 같은 성질이 있음.

 

① 교환 법칙이 성립.

 

② 스칼라 곲의 성질을 지님.

 

③ 상수와 다양한 값의 확률 변수간의 공분산은 0이다. (상관성 없음)

 

※ 모 공분산

 

모공분산이란 모집단의 공분산으로, 확률 변수 의편차와  확률 변수의 편차의 곱의 평균을 말함.

 

 

반응형