지금부터는 통계학 개론에 대해 공부를 시작해 보겠다.
============================================================================
1. 모집단(Population)
- 통계적인 관찰의 대상이 되는 집단 전체를 말함.
2. 표본(Sample)
- 전체 모집단의 단면이 된다는 가정하에서 모집단에서 선택된 모집단 구성 단위의 일부
3. 표본 추출 방법(Sampling)
- 모집단으로 부터 표본을 선택하는 행위를 표본 추출이라 함.
표본 추출 방법 | 상세 방법 | 내용 |
확률적 추출 | 단순 무작위 추출 | 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우 |
계통 추출 | 첫번째 표본을 임의로 선택하고, 일정 간격으로 다음 표본을 선택 | |
층화 추출 | 모집단을 성격에 따라 몇개의 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기의 표본을 무작위로 추출 | |
군집 추출 | 모집단의 특성에 따라 여러 개의 집단으로 나누고, 이들 집단 중에서 몇개를 선택한 후 선택된 집단 내에서 필요한 만큼의 표본을 임의로 선택 | |
비확률적 추출 | 판단 추출 | 전문지식이 있는 연구자가 자신의 판단에 따라 표본을 선택 |
할당 추출 | 모집단을 여러 집단으로 나눈 후, 각 집단에서 필요한 개수의 표본을 선택하되, 연구자가 자신의 판단에 따라 선택하는 경우 |
|
편의 추출 | 연구자가 쉽게 접근할 수 있는 표본을 선택하는 경우 |
4. 모수통계 Vs 비모수통계
- 모수통계 (Parametric Statistics) : 모집단의 특성이 정규분포를 이루고 있을 것이라는 가정하에 표본의 자료로부터
모집단의 특성을 추정하는 것.
* 측정치의 연속성과 선형성, 모집단의 어떤 특성의 정규분포성, 분산의 동질성의 조건을 가지고 있어야함.
- 비모수통계 (NonParametric Statistics) : 모집단의 특성이 정규분포를 이루고 있을 것이라는 가정을 하지 않는
상태에서 모집단의 특성을 추정하는 것으로, 선형성, 정규 분포성등의 조건이 없어도 됨.
5. 합집합과 교집합 그리고 조건부 확률
- 합집합 : 적어도 한쪽이 일어나는 사건
- 교집합 : 동시에 일어나는 사건
※ 사건 : 표본 공간상에서 특정한 조건을 만족하는 결과를 모아 놓은 집합 = 확률적 사건 = 사건 = 사상
- 조건부 확률 : 다른 어떤 사건이 발생하였다는 조건 하에서 특정 사건이 발생될 확률
ex) A가 떡을 먹을때, B가 빵을 먹을 확률?? 이런 느낌으로 보면 됨.
6. 베이즈의 정리(Bayes’ theorem)
- 어떤 사건이 서로 배반하는 원인 둘에 의해 일어난다고 할 때 실제 사건이 일어났을 때 이것이 두 원인 중 하나일
확률을 구하는 정리 (먼가 말이 매우 어렵다 ㅜㅠ)
- 베이즈 정리는 본래 역확률(inverse probability) 문제를 해결하기 위한 방법이었다.
즉, 조건부 확률 를 알고 있을 때, 전제와 관심 사건의 관계가 정반대인 조건부 확률 을 구하는 방법이었다.
- A는 불확실성을 계산해야 하는 대상이며,B는 관측하여 값을 알아낼 수 있는 대상
A의 확률은 B 가 관측된 후P(A)에서 P(A|B)로 변화하며, 베이즈 정리는 이때의 변화를 계산할때 사용
* Pr(A)는 A의 사전 확률로, 아직 사건 B에 관한 어떠한 정보도 알지 못하는 것을 의미
Pr(B)는 B의 사전 확률이며, 정규화 상수의 역할
* Pr(A|B)}는 B의 값이 주어진 경우에 대한 A의 조건부 확률
* Pr(B|A)}는 A가 주어졌을 때 B의 조건부 확률
* L(A|B)=Pr(B|A)이며, 이는B가 주어졌을 때 A의 가능도
Ex) 3대의 기계 A, B, C 에서 각각 재품을 생산하는데, 각 기계별로 불량률이 2%, 3%, 2% 라고 알고 있음.
이때 임의로 선택된 제품이 불량품일 경우, B 기계에서 제조 되었을 확률은? 형태의 문제를 풀때 활용.
============================================================================