본문 바로가기
데이터 및 Programing/Part3. 데이터 분석(ADsP 자격시험)

[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (카이 제곱 검정, 가설 검정, 유의 확률, 유의 수준, 확률적 표본 추출 방법)

by 깜장스 2022. 7. 18.
반응형

 

1. 카이 제곱 검정

 

- 관측 빈도와 기대 빈도의 차이를 통해서 확률 모형 데이터를 얼마나 잘 설명하는지 검정하는 통계적 방법

 

- 카이제곱 검정 유형은 교차 분할표 이용 여부에 따라 크게 일원 카이제곱 검정과 이원 카이제곱 검정으로 분류됨.

 

1) 일원 카이 제곱 검정

 

- 접합성 검정 : 모집단이 특정한 분포를 따른다는 가설에 대해 표본의 도수분포를 이용하여 검정

 

                         한 개의 범주 집단이 대상임.

 

<가설검정 사례>

 

귀무가설 : 세 후보의 지지율이 같다.

 

대립가설 : 세 후보의 지지율이 다르다.

 

2) 이원 카이 제곱 검정

 

- 독립성 검정 : 한 모집단에서 표본을 추출하였을 때 두 이상형 변량에 대한 독립성 여부를 조사하는 것.

 

<가설검정 사례>

 

귀무가설 : 두 변량이 서로 독립이다.

 

대립 가설 : 두 변량이 서로 관련이 있다.

 

- 동질성 검정 : 두 집단 이상에서 각 범주 간의 비율이 서로 동일한지 검정하는 방법

 

<가설검정 사례>

 

귀무가설 : 모든 표본들의 비율은 동일하다.

 

대립 가설 : 모든 표본들의 비율은 동일하지 않다.

 

→ 시험에서는 3가지 종류의 개념에 대해 출제됨.

 

2. 가설 검정

 

- 모집단 분포를 포함해서 모집단에 대한 통계적 추론을 실시하기 위해서는 추정과 가설 검정을 이용한다.

 

1) 가설 검정의 오류

 

- 가설 검정과 관련된 오류에는 두 가지가 있다.(1종, 2종)

 

- 1종 오류 =  α = 유의수준, 위험  수준

 

 

 

- 검정 통계량 : 귀무 가설의 진위 여부를 규명하기 위하여 가설 검정과 관련된 모집단으로부터 표본을 무작위로 추출하여

 

                       필요한 계산을 하는 표본 통계량을 말함.

 

- 2종 오류를 범할 확률 β는 대립 가설이 사실이기 때문에 당연히 귀무가설을 기각해야 함에도 불구하고,

 

 이를 채택하는 확률을 말함.

 

 따라서 (1-β)를 나타내는 검정력은 거짓인 귀무가설을 채택할 확률을 말함.

 

→ 시험에서는 1종, 2종 오류의 개념이 출제됨.

 

< 틀린 보기 유형 >

 

- 1종 오류와 2종 오류는 동시에 감소시킬 수 있다 (X)

 

- 가설 검정에는 2종 오류의 크기를 0.1, 0.05 등으로 고정시킨 뒤 기각역을 설정한다 (X)

 

  → 1종 오류 고정

 

 

3. 유의 확률, 유의 수준

 

- 유의 수준 (α): 1종 오류를 범할 확률의 최대값을 α라 하고 유의 수준이라 함.

 

- 유의 확률(p) : 귀무 가설이 맞다는 전제하에 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가

 

                         관측될 확률이다.

 

→ 시험에서는 p값의 해석에 관해 출제됨.

 

<출제 유형>

 

- p 값이 0.01이라면??

 

→ 귀무가설이 사실일 때 이런 결과가 나올 확률이 1/1000이다.

 

- 유의 확률이 작을수록 귀무가설에 대한 반증이 강하다 (O)

 

- 유의 확률은 귀무가설 하에서 계산된 값이다(O)

 

4. 확률적 표본 추출 방법

 

1) 단순 무작위 추출 : 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우이다.

 

모집단의 개체 수가 N 중에서 임의로 n(표본 수) 개를 선택한다면, 개발 개체가 선택될 확률은 모두 n/N으로 일정하다.

 

2) 계통 추출 : 모집단의 개체에 1,2,~ N이라는 일련번호를 부여한 후, 첫 번째 표본을 임의로 선택하고 일정 간격으로 

 

                      다음 표본을 선택한다.

 

3) 층화 추출 : 모집단을 성격에 따라 몇 개의 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기의 표본을 무작위로

 

                      추출한다.

 

4) 군집 추출 :  모집단을 특성에 따라 여러 개의 집단으로 나눈다. 이들 집단 중에서 몇 개를 선택한 후,

 

                      선택된 집단 내에서 필요한 만큼의 표본을 임의로 선택한다.

 

→ 시험에서 분포 개념 및 구분에 출제함.

 

 

 

 

반응형