본문 바로가기
데이터 및 Programing/Part3. 데이터 분석(ADsP 자격시험)

[ADsP 데이터분석 준전문가] 통계학 개론 (모집단, 표본, 표본추출방법, 모수통계, 비모수통계, 베이즈의 정리)

by 깜장스 2022. 3. 14.
반응형

지금부터는 통계학 개론에 대해 공부를 시작해 보겠다.

 

 

============================================================================

 

 

1. 모집단(Population)

 

- 통계적인 관찰의 대상이 되는 집단 전체를 말함.

 

모집단과 표본(출처: 통계청)

 

2. 표본(Sample)

 

- 전체 모집단의 단면이 된다는 가정하에서 모집단에서 선택된 모집단 구성 단위의 일부

 

 

3. 표본 추출 방법(Sampling)

 

- 모집단으로 부터 표본을 선택하는 행위를 표본 추출이라 함.

 

표본 추출 방법 상세 방법 내용
확률적 추출 단순 무작위 추출 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우
계통 추출 첫번째 표본을 임의로 선택하고, 일정 간격으로 다음 표본을 선택
층화 추출 모집단을 성격에 따라 몇개의 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기의 표본을 무작위로 추출
군집 추출 모집단의 특성에 따라 여러 개의 집단으로 나누고, 이들 집단 중에서 몇개를 선택한 후 선택된 집단 내에서 필요한 만큼의 표본을 임의로 선택
비확률적 추출 판단  추출 전문지식이 있는 연구자가 자신의 판단에 따라 표본을 선택
할당 추출 모집단을 여러 집단으로 나눈 후, 각 집단에서 필요한 개수의 표본을 선택하되,
연구자가 자신의 판단에 따라 선택하는 경우
편의 추출 연구자가 쉽게 접근할 수 있는 표본을 선택하는 경우

 

 

4. 모수통계 Vs 비모수통계

 

- 모수통계 (Parametric Statistics) : 모집단의 특성이 정규분포를 이루고 있을 것이라는 가정하에 표본의 자료로부터

 

                                             모집단의 특성을 추정하는 것.

 

* 측정치의 연속성과 선형성, 모집단의 어떤 특성의 정규분포성, 분산의 동질성의 조건을 가지고 있어야함.

 

- 비모수통계 (NonParametric Statistics) : 모집단의 특성이 정규분포를 이루고 있을 것이라는 가정을 하지 않는

 

                                       상태에서 모집단의 특성을 추정하는 것으로, 선형성, 정규 분포성등의 조건이 없어도 됨.

 

5. 합집합과 교집합 그리고 조건부 확률

 

합집합과 교집합

- 합집합 : 적어도 한쪽이 일어나는 사건

 

- 교집합 :  동시에 일어나는 사건

 

※ 사건 : 표본 공간상에서 특정한 조건을 만족하는 결과를 모아 놓은 집합 = 확률적 사건 = 사건 =  사상

 

- 조건부 확률 : 다른 어떤 사건이 발생하였다는 조건 하에서 특정 사건이 발생될 확률

 

ex) A가 떡을 먹을때, B가 빵을 먹을 확률?? 이런 느낌으로 보면 됨.

 

6. 베이즈의 정리(Bayes’ theorem)

 

- 어떤 사건이 서로 배반하는 원인 둘에 의해 일어난다고 할 때 실제 사건이 일어났을 때 이것이 두 원인 중 하나일
 
  확률을 구하는 정리 (먼가 말이 매우 어렵다 ㅜㅠ)

 

- 베이즈 정리는 본래 역확률(inverse probability) 문제를 해결하기 위한 방법이었다.

 

  즉, 조건부 확률 를 알고 있을 때, 전제와 관심 사건의 관계가 정반대인 조건부 확률 을 구하는 방법이었다.

 

- A는 불확실성을 계산해야 하는 대상이며,B는 관측하여 값을 알아낼 수 있는 대상
 
  A의 확률은 가 관측된 후P(A)에서 P(A|B)로 변화하며, 베이즈 정리는 이때의 변화를 계산할때 사용

 

* Pr(A)는 A 사전 확률로, 아직 사건 B에 관한 어떠한 정보도 알지 못하는 것을 의미

 

  Pr(B)는 B의 사전 확률이며, 정규화 상수의 역할

 

* Pr(A|B)} B의 값이 주어진 경우에 대한 A 조건부 확률

 

* Pr(B|A)} A가 주어졌을 때 B 조건부 확률

 

* L(A|B)=Pr(B|A)이며, 이B가 주어졌을 때 A 가능도

 

Ex) 3대의 기계 A, B, C 에서 각각 재품을 생산하는데, 각 기계별로 불량률이 2%, 3%, 2% 라고 알고 있음.

 

이때 임의로 선택된 제품이 불량품일 경우, B 기계에서 제조 되었을 확률은? 형태의 문제를 풀때 활용.

 

 

============================================================================

반응형