1. 기댓값 (Expectation Value)
- 어떤 확률 과정을 무한히 반복했을 때, 얻을 수 있는 값의 평균으로서 기대할 수 있는 값을 의미함.
- 사건이 발생해서 얻는 값과 그 사건이 일어날 확률의 곱을 모든 사건에 대해 합한 값.
- 엄밀히 보면 가중 평균이라고 볼수 있음.
- 기대값은 성형성을 가지며,
이 성됩된다.
(X,Y는 확률 변수이며, a는 상수)
2. 분산 (variance)
- 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 수
- 기댓값은 확률 변수의 위치를 나타내고 분산은 그것이 얼마나 퍼져 있는지를 나타냄.
- 관측 값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나누어줌.
(즉 편차 제곱의 평균값임, 관측값에 평균을 뺀값을 그냥 더해주면 0이 되므로 제곱해서 더해줌.)
3. 공분산 (Covariance)
- 2개의 확률 변수의 선형 관계를 나타내는 값.
(두 변수 사이에 어떤 상관 관계가 있는지를 알 수 있음)
- 분산이라는 개념을 확장하여 두 개의 확률 변수의 흩어진 정도를 공분산이라고 하는 것
- X의 편차와 Y의 편차의 곱의 기댓값을 의미함.
① 공분산이 0보다 크다 = 확률변수 X의 값이 커질 때, Y의 값도 커지는 경향이 있음을 의미
② 공분산이 0보다 크다 = 확률변수 X의 값이 커질 때, Y의 값도 작아지는 경향이 있음을 의미
③ 공분산 = 0 이면 두 변수 사이에는 아무런 상관 관계가 없다는 것을 의미.
공분산은 아래와 같은 성질이 있음.
① 교환 법칙이 성립.
② 스칼라 곲의 성질을 지님.
③ 상수와 다양한 값의 확률 변수간의 공분산은 0이다. (상관성 없음)
※ 모 공분산
모공분산이란 모집단의 공분산으로, 확률 변수 의편차와 확률 변수의 편차의 곱의 평균을 말함.