[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (시계열 모형, 시계열 분석 기법)
1. 시계열 모형 1) 정상성 : 평균과 분산이 일정하고, 주기와 특정 트렌드가 존재하지 않는 성질 - 평균값은 시간 t에 관계 없이 일정하다. - 분산값은 시간 t에 관계없이 일정하다. - 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다. 2) 비정상 → 정상 시계열로 전환하는 방법 - 시계열의 평균이 일정하지 않은 경우에는 원시계열에 차분 - 계정성을 갖는 비정상 시계열은 정상시계열로 바꿀 때 계정 차분 - 분산이 일정하지 않는 경우에는 원계열에 자연로그(변환)를 취하면, 정상 시계열이 됨. 3) ARIMA(p,d,q) : ARIMA(p, d, q) 모형은 차수 p, d, q의 값에 따라 모형의 이름이 다르게 됨. p는 AR모형과 관련, q는 MA 모형과 관련 있는 차수다. d는 ARIMA에..
2022. 8. 1.
[ADsP 데이터 분석 준전문가] 3과목 데이터의 분석 (Box Plot, 상자그림, 데이터 분포의 흩어짐, 산포, 평균, 중위수, 최빈치, 자료의 척도, 확률 변수와 확률 분포)
1. Box Plot(상자 그림) 1) Box Plot을 통해 얻을 수 있는 정보 - 5개의 통계량과 자료의 평균값, 사분위수 범위를 쉽게 파악 - 이상치에 대한 추가적 조사를 할 수 있도록 함. - 자료 분포의 비 대칭도를 파악 → 자료의 평균과 중앙값을 비교 - 특히 그룹 간의 분포를 비교하는데 효과적 → 시험에서는 단답형으로 하한값, 상한값 구하는 형태와 활용과 의미 관련 하여 출제됨. 2. 데이터 분포의 흩어짐 (산포) 1) 변동계수 : 표준편차/평균, 측정단위가 서로 다른 데이터를 비교할 때 사용 2) IQR(사분위수 범위) : Q3 - Q1 3) 범위 : 최댓값 - 최솟값 4) 왜도 (Skewness) : 정규분포이면 왜도는 0, 0보다 크면 왼쪽으로 치우진 분포 5) 첨도(Kurtosis) ..
2022. 7. 16.