본문 바로가기
반응형

데이터 및 Programing/Part1. Basic Knowledge13

[ML Algorithm] 전이 학습(Transfer Learning) Machine Learning의 하나인 전이 학습 (Transfer Learning)에 대해 알아보겠습니다. 1. 전이학습 (Transfer Learning) 하나의 문제를 해결하고 다른 관련 문제에 적용하면서 얻은 지식을 저장하는 데 중점을 둡니다 이미지넷과 같이 아주 큰 데이터셋에 훈련된 모델의 가중치를 가지고 와서 우리가 해결하고자 하는 과제에 맞게 재보정해서 사용하는 것을 의미합니다. 쉽게 말하면 자동차를 인식하는 가중치를 이용해서 버스를 구분해내는 문제에 활용하거나 고양이를 구분하는 가중치를 이용해서 호랭이를 구분해내게 하는 것을 말한다. 왜 이런 학습방법이 생겨났느냐에 대해서는 아무래도 현실적인 문제가 큰 영향으로 볼 수 있다. 우리가 알고 있는 머신러닝, 딥러닝은 고사양의 기기에서 이루어졌다.. 2022. 4. 14.
[ML Algorithm] 딥러닝(Deep Learning) 합성곱 신경망(CNN, Convolution Neural Network, 패딩, 풀링, 채널) Deep Learning 방법 중 많이 쓰이는 CNN(Convolution Neural Network)에 대해 알아보겠습니다. 1. CNN 이란? - 합성곱이라는 연산을 사용하는 신경망을 일컫는다. - 합성곱이란 쉽게 말해서 두 개의 합수를 곱해서 합하는 것이라고 보면 된다. 위의 수식은 합성곱을 나타낸 수식이다. 여기서 f(), g() 함수를 합성곱 하였으며, 이때 g() 함수의 경우 반전(-τ), 그리고 t만큼 이동시켰다. 그리고 이를 타우가 변화하면서의 결과를 저장하는 것을 합성곱(Convolution)이라고 한다. - 합성곱을 사용하는 이유! 함수 f()는 우리가 가지고 있는 본래의 신호, 행렬, 이미지 등으로 보면 됨. 이때 함수 g()는 필터, 가중치, 커널 등으로 볼 수 있다. 이를 합성곱 .. 2022. 3. 20.
[ML Algorithm] Clustering (머신러닝, 군집화, 군집 분석, 두 점사이의 거리, 최소연결법, 최장연결법, 중심연결법, 평균연결법, 덴드로그램, K means, DBSCAN) Machine Learning Algorithm 중 하나인 Clustering에 대해 알아보겠습니다. 1. 군집화 (Clustering) 란?! - 어떤 데이터가 있을 때 그 데이터가 어떻게 서로 무리(군집)를 지었는지 패턴을 알아보는 것. - 클러스터란 비슷한 특성을 가진 데이터들의 집단 - 목적에 따라(마케팅, 데이터 분석용도 등)군집 나누기는 달라질 수 있음. - "거리"의 개념으로 군집을 정의함 ex) 비슷한 아이들은 거리가 가깝고, 다른 아이들은 거리가 멀다. 2. 거리행렬과 두 점 사이의 거리를 계산하는 방법 - 거리행렬 : 두 점 사이의 거리를 배열하여, 행렬로 표시한 것 - 두 점 사이의 거리를 계산하는 방법 1) 최단 연결법 (Single Linkage) 데이터 A 와 군집 C와의 거리,.. 2022. 2. 2.
[ML Algorithm] Decision Tree (머신러닝, 의사결정나무, 엔트로피, 가지치기) Machine Learning Algorithm 중 하나인 Decision Tree에 대해 알아보겠습니다. 1. 의사결정 트리(Decision Tree) 란?! - 어떤 항목에 대한 관측값과 목표값을 연결시켜주는 예측 모델 - 지도 학습으로 가장 유용하게 사용되고 있는 방법 중 하나임. - 의사결정 나무를 만들기 위한 노드와 분기점을 찾기 위해서는 엔트로피를 이해해야함. - 일반적으로 엔트로피의 개념을 쓰긴 하지만, 지니계수를 이용한 방법도 사용됨. 2. 엔트로피와 지니계수 * 여기서 말하는 엔트로피는 열역학에서 말하는 것과 유사한 것으로 정보의 복잡도를 의미함. 데이터가 어느 정도 순수한지, 분류가 잘되는 정도인지, 질서가 있는지 등을 측정하는 수치 정보 엔트로피라 부르기도 함. 박스로 둘러싸인 A 영.. 2022. 1. 29.
반응형