1. 카이 제곱 검정
- 관측 빈도와 기대 빈도의 차이를 통해서 확률 모형 데이터를 얼마나 잘 설명하는지 검정하는 통계적 방법
- 카이제곱 검정 유형은 교차 분할표 이용 여부에 따라 크게 일원 카이제곱 검정과 이원 카이제곱 검정으로 분류됨.
1) 일원 카이 제곱 검정
- 접합성 검정 : 모집단이 특정한 분포를 따른다는 가설에 대해 표본의 도수분포를 이용하여 검정
한 개의 범주 집단이 대상임.
<가설검정 사례>
귀무가설 : 세 후보의 지지율이 같다.
대립가설 : 세 후보의 지지율이 다르다.
2) 이원 카이 제곱 검정
- 독립성 검정 : 한 모집단에서 표본을 추출하였을 때 두 이상형 변량에 대한 독립성 여부를 조사하는 것.
<가설검정 사례>
귀무가설 : 두 변량이 서로 독립이다.
대립 가설 : 두 변량이 서로 관련이 있다.
- 동질성 검정 : 두 집단 이상에서 각 범주 간의 비율이 서로 동일한지 검정하는 방법
<가설검정 사례>
귀무가설 : 모든 표본들의 비율은 동일하다.
대립 가설 : 모든 표본들의 비율은 동일하지 않다.
→ 시험에서는 3가지 종류의 개념에 대해 출제됨.
2. 가설 검정
- 모집단 분포를 포함해서 모집단에 대한 통계적 추론을 실시하기 위해서는 추정과 가설 검정을 이용한다.
1) 가설 검정의 오류
- 가설 검정과 관련된 오류에는 두 가지가 있다.(1종, 2종)
- 1종 오류 = α = 유의수준, 위험 수준
- 검정 통계량 : 귀무 가설의 진위 여부를 규명하기 위하여 가설 검정과 관련된 모집단으로부터 표본을 무작위로 추출하여
필요한 계산을 하는 표본 통계량을 말함.
- 2종 오류를 범할 확률 β는 대립 가설이 사실이기 때문에 당연히 귀무가설을 기각해야 함에도 불구하고,
이를 채택하는 확률을 말함.
따라서 (1-β)를 나타내는 검정력은 거짓인 귀무가설을 채택할 확률을 말함.
→ 시험에서는 1종, 2종 오류의 개념이 출제됨.
< 틀린 보기 유형 >
- 1종 오류와 2종 오류는 동시에 감소시킬 수 있다 (X)
- 가설 검정에는 2종 오류의 크기를 0.1, 0.05 등으로 고정시킨 뒤 기각역을 설정한다 (X)
→ 1종 오류 고정
3. 유의 확률, 유의 수준
- 유의 수준 (α): 1종 오류를 범할 확률의 최대값을 α라 하고 유의 수준이라 함.
- 유의 확률(p) : 귀무 가설이 맞다는 전제하에 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가
관측될 확률이다.
→ 시험에서는 p값의 해석에 관해 출제됨.
<출제 유형>
- p 값이 0.01이라면??
→ 귀무가설이 사실일 때 이런 결과가 나올 확률이 1/1000이다.
- 유의 확률이 작을수록 귀무가설에 대한 반증이 강하다 (O)
- 유의 확률은 귀무가설 하에서 계산된 값이다(O)
4. 확률적 표본 추출 방법
1) 단순 무작위 추출 : 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우이다.
모집단의 개체 수가 N 중에서 임의로 n(표본 수) 개를 선택한다면, 개발 개체가 선택될 확률은 모두 n/N으로 일정하다.
2) 계통 추출 : 모집단의 개체에 1,2,~ N이라는 일련번호를 부여한 후, 첫 번째 표본을 임의로 선택하고 일정 간격으로
다음 표본을 선택한다.
3) 층화 추출 : 모집단을 성격에 따라 몇 개의 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기의 표본을 무작위로
추출한다.
4) 군집 추출 : 모집단을 특성에 따라 여러 개의 집단으로 나눈다. 이들 집단 중에서 몇 개를 선택한 후,
선택된 집단 내에서 필요한 만큼의 표본을 임의로 선택한다.
→ 시험에서 분포 개념 및 구분에 출제함.