본문 바로가기

강화학습자습1

[자습일지] 강화학습 주요 기법 출처 : 파이썬과 케라스를 이용한 딥러닝/강화학습 주식투자 - 퀀티랩 지음 등장하는 모든 용어는 이전 글에 설명되어 있다. 이전 글 2020/08/26 - [IT/[딥러닝]] - [자습일지] 강화학습 기초 [자습일지] 강화학습 기초 강화학습은 머신러닝의 한 종류로 어떠한 환경에서 어떠한 행동을 했을 때 그것이 잘 된 행동인지 잘못된 행동인지를 나중에 판단하고 보상(또는 벌칙)을 줌으로써 반복을 통해 스스로 학습하�� coffee-with-me.tistory.com 몬테카를로 학습 몬테카를로 예측과 제어 중 예측에서는 샘플링을 통해 상태 가치 함수를 학습해나간다. 충분한 에피소드를 거치고 나면 상태 가치 함수가 정답에 가까워질 것이다. 샘플링한 상태들에 대한 경험을 통해 획득 보상(Gain)을 다음과 같이.. 2020. 8. 27.

이전 1 다음

티스토리툴바