본문 바로가기
반응형

데이터 및 Programing/Part3. 데이터 분석(ADsP 자격시험)21

[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (시계열 모형, 시계열 분석 기법) 1. 시계열 모형 1) 정상성 : 평균과 분산이 일정하고, 주기와 특정 트렌드가 존재하지 않는 성질 - 평균값은 시간 t에 관계 없이 일정하다. - 분산값은 시간 t에 관계없이 일정하다. - 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다. 2) 비정상 → 정상 시계열로 전환하는 방법 - 시계열의 평균이 일정하지 않은 경우에는 원시계열에 차분 - 계정성을 갖는 비정상 시계열은 정상시계열로 바꿀 때 계정 차분 - 분산이 일정하지 않는 경우에는 원계열에 자연로그(변환)를 취하면, 정상 시계열이 됨. 3) ARIMA(p,d,q) : ARIMA(p, d, q) 모형은 차수 p, d, q의 값에 따라 모형의 이름이 다르게 됨. p는 AR모형과 관련, q는 MA 모형과 관련 있는 차수다. d는 ARIMA에.. 2022. 8. 1.
[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (상관 분석, 주성분 분석) 1. 상관 분석 ① 상관계수로 변수 간의 유의성을 확인할 수 있다 (x) ② 상관분석은 두 변수의 인과관계도 알 수 있다 (x) ③ 상관 분석의 유의 확률 정보로 상관성의 방향을 알 수 있다 (x) 1) 피어슨 상관계수 : 두 변수 X 와 Y 간의 선형 상관관계를 계량화한 수치 피어슨의 상관 계수를 제곱해줌으로써 결정계수를 얻을 수 있다. 두 변수 간의 선형 관계 측정 연속형 변수만 가능 2) 스피어만 상관계수 : 두 변수의 순위 사이의 통계적 의존성을 측정하는 비모수적인 척도이다. 이는 두 변수의 관계가 단조함수를 사용하여 얼마나 잘 설명될 수 있는지를 평가한다. 스피어만 상관계수는 순위가 매겨진 변수 간의 피어슨 상관 계수로 정의가 가능 두 변수 간의 비선형적 관계 측정 연속형 외에 순서형도 가능. .. 2022. 7. 25.
[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (카이 제곱 검정, 가설 검정, 유의 확률, 유의 수준, 확률적 표본 추출 방법) 1. 카이 제곱 검정 - 관측 빈도와 기대 빈도의 차이를 통해서 확률 모형 데이터를 얼마나 잘 설명하는지 검정하는 통계적 방법 - 카이제곱 검정 유형은 교차 분할표 이용 여부에 따라 크게 일원 카이제곱 검정과 이원 카이제곱 검정으로 분류됨. 1) 일원 카이 제곱 검정 - 접합성 검정 : 모집단이 특정한 분포를 따른다는 가설에 대해 표본의 도수분포를 이용하여 검정 한 개의 범주 집단이 대상임. 귀무가설 : 세 후보의 지지율이 같다. 대립가설 : 세 후보의 지지율이 다르다. 2) 이원 카이 제곱 검정 - 독립성 검정 : 한 모집단에서 표본을 추출하였을 때 두 이상형 변량에 대한 독립성 여부를 조사하는 것. 귀무가설 : 두 변량이 서로 독립이다. 대립 가설 : 두 변량이 서로 관련이 있다. - 동질성 검정 :.. 2022. 7. 18.
[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (Box Plot, 상자그림, 데이터 분포의 흩어짐, 산포, 평균, 중위수, 최빈치, 자료의 척도, 확률 변수와 확률 분포) 1. Box Plot(상자 그림) 1) Box Plot을 통해 얻을 수 있는 정보 - 5개의 통계량과 자료의 평균값, 사분위수 범위를 쉽게 파악 - 이상치에 대한 추가적 조사를 할 수 있도록 함. - 자료 분포의 비 대칭도를 파악 → 자료의 평균과 중앙값을 비교 - 특히 그룹 간의 분포를 비교하는데 효과적 → 시험에서는 단답형으로 하한값, 상한값 구하는 형태와 활용과 의미 관련 하여 출제됨. 2. 데이터 분포의 흩어짐 (산포) 1) 변동계수 : 표준편차/평균, 측정단위가 서로 다른 데이터를 비교할 때 사용 2) IQR(사분위수 범위) : Q3 - Q1 3) 범위 : 최댓값 - 최솟값 4) 왜도 (Skewness) : 정규분포이면 왜도는 0, 0보다 크면 왼쪽으로 치우진 분포 5) 첨도(Kurtosis) .. 2022. 7. 16.
반응형