본문 바로가기
IT/[딥러닝]

[자습일지] 딥러닝 활용 방법

by Coffee With Me 2020. 8. 25.

딥러닝으로 풀고자 하는 문제

 

분류 문제(classification)

ex) 자동차의 길이, 너비, 높이, 바퀴 크기, 엔진 마력 등의 특징을 보고 경차, 준중형차, 중형차, 대형차 중 한 가지 분류로 분류하는 문제.

 

군집화(clustering)

데이터 인스턴스(data instance)를 그룹화하기 위한 문제. 비슷한 특징을 가지는 데이터 인스턴스끼리 그룹화하는 것.

ex) 자동차의 길이, 너비, 높이, 바퀴 크기, 엔진 마력 등의 특징을 보고 비슷한 인스턴스끼리 그룹화한다. 그룹화된 결과를 보고 경차, 준중형차 등으로 결정하는 것은 사람의 개입이 필요.

 

회귀(regreesion)

불완전한 데이터의 값(value)를 알아내기 위한 문제이다. 예를 들어 한 데이터 인스턴스 중에 자동차의 너비, 높이, 바퀴의 크기, 엔진 마력 등의 특징은 아는데, 길이를 모른다고 할 때 다른 데이터 인스턴스의 값을 근거로 불완전한 데이터로 구성된 인스턴스의 길이 특징을 예측할 수 있다.

 

 

 

학습방법

 

지도학습(supervised learning)

레이블이 있는 데이터를 학습하는 방법으로, 주로 분류와 회귀 문제를 다룹니다. 정답이 있는 자료이기 때문에 비교적 학습이 쉽고 효과적이다. 그러나 레이블을 데이터마다 부여하려면 일반적으로 많은 비용이 요구된다. 학습 데이터는 적게는 수백, 많게는 수백만 혹은 그 이상으로 방대하다. 사람이 일일이 레이블을 부여하는 것 조차 불가능할 수 있다.

 

비지도학습(unsupervised learning)

레이블이 없는 데이터를 학습하는 방법이다. 주로 데이터를 그룹화하거나 데이터의 특징을 분석하기 위해 사용한다. 비지도학습은 정답이 없는 데이터를 분석하는 것이므로 데이터에 레이블을 부여할 필요가 없다. 즉, 데이터를 준비하는 비용이 적다. 그러나 분석된 결과 군집마다 어떠한 의미를 갖는지는 사람이 개입해 확인해야 하는 경우가 많다.

 

강화학습(reinforcement learning)

에이전트가 어떠한 환경에서 행동을 수행했을 때 보상을 함으로써 그 보상을 최대로 하는 행동을 수행하도록 학습하게 하는 방법이다. 주로 어떤 행동을 결정하는 분류 문제나 보상을 예측하는 회귀 문제를 다룬다. 강화학습은 레이블이 없는 데이터를 학습할 수 있지만, 에이전트와 환경을 구성하는 추가 비용을 필요로 한다.

 

출처 : 파이썬과 케라스를 이용한 딥러닝 강화학습 주식투자 - 퀀티랩 지음 http://quantylab.com/

 

퀀티랩 - Quantylab

코스피 Upward 2329.83 +25.24 +1.10%

quantylab.com