총체적 난국;;

최근 RL 논문 스터디에 참여하여 딥마인드의 아타리 DQN논문(많은 분들이 다루었던 바로 그 논문!)을 발표하게 되었다.(최근이라고 이야기 하고는있지만 벌써 몇달 전 이야기..) 나름대로 발표 준비를 하면서 예~전에 만들었던 Pong 환경을 가져다가 DQN을 적용할 수 있게 개조하고있는데.. 여러모로 총체적 난국이다.. 일단 환경 자체가 머신러닝 용 환경이 아니라 게임 구현 자체에 초점이 맞춰져있어 Train용으로 재설계했어야하는 부분이 많았고, 무슨 생각인지 좌표를 소숫점까지 써서 연산하게 해놓아서 좌표계까지 드러내서 정수 좌표계로 바꿨다. 어떻게든 기존 코드 덩어리들을 DQN을 적용할 수 있는 환경 함수로 만드는 때까지 성공했..........

총체적 난국;;에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.

원문링크 : 총체적 난국;;

등록된 다른 글

[RoboCup Junior 2020] Rescue Line "연기는 계속되도 우리의 열정은 언제나 그대로!"

총체적 난국;;

등록된 다른 글

[RoboCup Junior 2020] Rescue Line "연기는 계속되도 우리의 열정은 언제나 그대로!"

이그나이트 스토리텔링 경진대회 2018 후기 "난생 처음으로 발표준비를 해보았습니다."

[하스스톤 등급전] 그저 덧셈을 못해서 킬각을 못볼 뿐..

그냥 근황 및 공지사항..

2018년 11~1월자 개발이야기

[8년 전 오늘] NXT_캔 떨어트리기

WRO2018 Thailand 후기 "입상하지 못한 우리 팀이 남길 수 있는 최대한의 흔적은 이 글이다."

BanG Dream! 걸파피코 곱빼기_#02 포핀빵

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티