본문 바로가기
데이터 및 Programing/Part3. 데이터 분석(ADsP 자격시험)

[ADsP 데이터 분석 준전문가] 1과목 데이터의 이해 (빅데이터의 특징, 빅데이터의 기능, 빅데이터의 본질적 변화, 빅데이터 활용 기법, 빅데이터 시대의 위기 ..

by 깜장스 2022. 5. 29.
반응형

 

1. 빅데이터의 특징


① Volume (데이터의 크기) : 생성되는 모든 데이터를 수집

② Variety (데이터의 다양성) : 정형화된 데이터를 넘어, 텍스트, 오디오, 비디오 등 모든 유형의 데이터를 분석 대상

③ Velocity (데이터의 속도) : 두 가지 관점의 속도를 의미함.

→ 시험에서 각각의 정의를 물어보거나, 이 외의 것을 적어놓고 아닌 것을 찾는 형태가 나옴.

 

2. 빅데이터의 기능


① 빅데이터는 산업혁명의 석탄, 철에 비유된다 (혁명!)

② 빅데이터는 원유에 비유된다. (생산성 향상!)

③ 빅데이터는 렌즈에 비유된다. (산업 전방에 영향을 끼침!)

④ 빅데이터는 플랫폼에 비유된다. (공동 활용!)

→ 시험에서 플랫폼이 주요하다고 생각된다. 특히 공동활용 목적!, 페이스북! = 플랫폼 이런 형태로 알고 있음

문제 푸는데 수월함

 

3. 빅데이터의 본질적 변화


① 정보의 사전처리에서 사후처리 시대로

② 표본조사에서 전수조사

③ 질보다 으로

④ 인과관계에서 상관관계

→ 시험에서 본직적인 변화를 바르게 연결한 것은? 잘못 연결한 것은? 형태로 물어보며, 특히 표본조사가 잘 나오는 것 같음.

그리고 구글의 자동 번역! 은 질보다 양에 해당함.

 

 

4. 빅데이터 활용 기법

 

종류 내용 예시
연관규칙 어떤 변수 간에 주목할만한 상관관계가 있는지를 찾아내는 방법 마트에서 상관 관계가
높은 상품을 함께 진열
유형분석 사용자가 어떤 특성을 가진 집단에 속하는가? 와 같은 문제를 해결하고자 할 때 사용 온라인 수강생들의 특성에
따라 분류
유전 알고리즘 최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야하는가? 와 같은 최적화의
매커니즘을 찾아가는 방법
연료 효율적인 차를 개발하기 위해 어떻게 원자재와 엔지니어링을 결합해야하는가?

응급실에서 의사를 어떻게 배치하는 것이 가장 효율적인가?
기계학습 기존의 시청 기록을 바탕으로 시청자가 현재 보유한 영화 중에서 어떤 것을 가장 보고 싶어 할까 와 같은 문제를 해결할 때 사용. 넷플릭스 영화 추천
회귀 분석 구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가? 와 같은 질문에 답할 때 사용
분석자는 독립변수를 사용하여, 종속변수가 어떻게 변하는지를 보며 두 변수의 관계를 파악
 
감정 분석 새로운 환불 정책에 대한 고객의 평가는 어떠한가?를 알고 싶을 때 "후기"
소셜 미디어에 나타난의견을 바탕으로 고객이 원하는 것을 찾아낼때 사용

소셜 네트워크 분석 영향력 있는 사람을 찾아낼 수 있느면, 고객들 간 소셜 커머스 관계를 파악할 수 있음.  

→ 시험에서 분석 기법의 사례를 보여주면서 알맞은 것을 물어보는 형태로 출제됨.

특히 감정 분석 / 소셜 네트워크 분석을 잘 구분해야 할 것임.

 

5. 빅데이터 시대의 위기 요인과 통제 방안


① 사생활 침해

- 위기 요인 : 2, 3차적 목적으로 활용하며, 사생활 침해를 넘어 사회 경제적 위협으로 변형될 수 있음.

- 통제 방안 : 정보 사용자에게 책임을 지움

② 책임 원칙의 훼손

- 위기 요인 : 범죄 예측 프로그램과 같이 분석 대상이 되는 사람들은 예측 알고리즘의 희생양이 될 가능성 증가.

- 통제 방안 : 기존의 책임원칙을 더 보강하고 강화

③ 데이터의 오용

- 위기 요인 : 예측이 항상 맞을 수는 없다.

- 통제 방안 : 알고리즈미스트의 역활 요구

알고리즈미스트 : 데이터 분석 알고리즘으로 인해 피해를 입은 사람을 구제하는 전문가.

→ 시험에서 각 요인에 맞는 통제 방향을 찾는 형태로 출제됨.

ex ) 책임원칙의 훼손 - 정보 사용자에게 책임을 지움 은 틀린 것임!

사생활 침해 - 정보 제공자에게 책임을 지움 은 틀린 것! 의 형태임.

6. 빅데이터의 3요소


① 데이터 ②기술 ③인력

→ 시험에서 3요소로 바르게 짝지은 것은? 같은 형태로 출제됨.

 

7. 데이터 사이언스


- 데이터로부터 의미 있는 정보를 추출하는 방법.

- 통계학이 정형화된 실험 데이터를 분석 대상으로 하는 것에 비해 데이터 사이언스는 정형 또는 비정형을 막론하고

다양한 유형의 데이터를 대상으로 총체적 접근법을 사용한다는 것이 통계학과의 차이

→ 시험에서 데이터 사이언스에 대한 설명을 적고 단답형으로 답으로 요구하는 형태로 출제

또는 정의를 설명하고 데이터 사이언스를 찾는 형태로도 출제됨.

반응형