import matplotlib.pyplot as plt import numpy as np import math # Env physics g = 9.81 dt = 0.1 t = 0 angle = np.array([15, 30, 45, 60]) throw_v = 20 trajectories = [[(0,0)] for _ in range(len(angle))] dones = np.zeros_like(angle, dtype=np.bool) all_done = False fig, ax = plt.subplots() while(not all_done): ax.cla() ax.set_title("Throw the ball!") ax.set_xlim(-1, 600) ax.set_ylim(-1, 200) for i i..
Today # graph neural network에 대해 이론적으로 학습 1. 입문자료 www.youtube.com/watch?v=bA261BF0bdk 2. 자세한 자료 www.youtube.com/watch?v=cWIeTMklzNg 3. 좋은 인사이트를 주는 자료 CNN과 GNN 관계등 newsight.tistory.com/313 Graph Neural Networks 0. Convolutional Neural Networks의 Graph 해석 Karate club graph, colors denote communities obtained via modularity-based clustering (Brandes et al., 2008) 위와 같은 그래프 형태의 데이터를 학습하기.. newsight.t..
Schedulnet review. Tommorow. attention + graph attention dmqm.korea.ac.kr/activity/seminar?p=1&s%3D 고려대학교 DMQA 연구실 고려대학교 산업경영공학부 데이터마이닝 및 품질애널리틱스 연구실 dmqa.korea.ac.kr dmqm.korea.ac.kr/activity/seminar/295 고려대학교 DMQA 연구실 고려대학교 산업경영공학부 데이터마이닝 및 품질애널리틱스 연구실 dmqa.korea.ac.kr
# PG 코딩이 거의 마무리되었고 DQN관련 강의를 들었다. 어제 술을 좀 세게 마신 탓에 많이 하진 못했지만 그래도 나가서 부여잡으면서 한게 어딘가. 좀 더 열심히 하긴 해야했다. # 그동안 좀 해야하는데 밀린게 ADD모델 튜닝과 논문 컨텐츠 추가, 그리고 ETRI 플로우넷 관련 학습을 좀 해야하는데 강화학습만 하려다보니 못한게 좀 걸린다. 언젠가 해야겟지. # 가제보 알고리즘 수정을 아직 못하고있다. 적어도 다음주중에 많이 바꿔봐야 할 듯 하다. # 내일은 드디어! 모델 베이스드 알고리즘을 배운다. 신난다 ㅎㅎㅎㅎㅎㅎㅎ
# PG복습과 실습 병행중.. 실제로 구현하면서 공부하니 확실히 머리속에 꽂혀들어오는 느낌이다. 여기서 시간을 너무 지체한 것같아서 좀 아쉽긴 하지만, 그래도 어느정도 내가 DRL을 기초부터 알고있다고 자신할 수 있는 발판이 될수 있겠으면 좋겠다. # 나만의 무기, 이거하나는 잘한다. 내가 동경해왔던 상태이다. 앞으로 어떻게 상황에따라 틀어질지는 모르겠지만, 적어도 지금만큼은 그 이상향을 향해 공부해나간다는 느낌이 좋다. 대학원에 와서 다행이다. 취업했으면 이런 기분 느끼지 못했을 것이다. # 생활루틴을 정했다. 8시기상해서 9시 출근후 11시까지 근무, 그리고 2시까지 이렇게 하루를 정리하면서 쉬거나 혹은 다른 외부활동을 잠깐하는 것으로 마무리할것이다. 14시간을 집중해서 쏟는 거라면 괜찮겠지 # 가제..
논문 메모는 본격적인 논문리뷰가 아닌 노트장에 대충 끄적이는 느낌의 포스팅이 될 것이다. 본격적인 리뷰는 메모가 어느정도 쌓이거나 좀더 의미있는 고찰이 가능해진 시점에 테마에서 중요하다 생각되는 논문을 위주로 정리한다. 처음으로 써보는 논문 관련 포스팅. 최근 ICRA 2019에 업로드된 강화학습과 관련된 논문들을 찾던 중 관심 갖게된 군중(human crowd)와 무인 이동 로봇의 상호작용에 관한 내용이다. 상호작용 자체에 대해 다룬 논문도 많지만 이논문은 특히 deep reinforcement learning을 활용한 navigation에 관한 문제를 풀고있다. 실질적으로 군중속에서 로봇이 어떻게 움직여야 효율적으로 목적지에 도달할지 학습하는 것이 목표이다. Value function을 네트워크로 근..