티스토리 뷰
강화학습 공부한다고 하면서 가장 기본이 되는 알고리즘하나 손으로 안짜봤다는 사실이 창피했다. 적어도 기본적인 DRL코드정도는 내손으로 짜볼 수 있고 변형할 수 있는 사람이 되고 싶다. 다음주는 ETRI출장을 가니까 그에대한 대비책의 계획도 세워야 한다.
1. pg에대한 이론적이해
2. q-learning을 gym에서 적용해봄
=========================
1. 대회 가제보 코드 해보기
2. REINFORCE코드 직접 짜보기
3. 논문읽기
댓글