[인공지능] RL(강화학습) 2강 - Frozen Lake with DQN 구현(1)

본격적으로 Frozen Lake 예제를 살펴보며 이론을 더 이해해보자. 우리가 탐험할(?) 호수는 다음과 같이 생겼다. 우리는 0칸인 start에서 시작해서 빙판이 깨진 5, 7, 11, 12 칸을 피하고 15칸인 goal 에 도달해야 한다. 일단 구글 코랩을 통해서 맵을 로딩해보자. 돌리면 다음과 같이 나온다 ( 랜덤이니 내가 돌린 결과와 다르게 나올 수 있다. ) 출력한 결과 그대로 읽으면 된다. 이 경우에는 출발지에서 Right 했다가 Down 해서 구멍에 빠졌다. 이 코드에서 중요한 함수는 다음과 같이 2개다. ㅁ action = env.action_space.sample() 랜덤으로 행동을 받는다. 행동은 동서남북이며 숫자 0~3 값을 돌려주는데 다음과 같이 매핑되어있다. ㅁ..........

[인공지능] RL(강화학습) 2강 - Frozen Lake with DQN 구현(1)에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.

원문링크 : [인공지능] RL(강화학습) 2강 - Frozen Lake with DQN 구현(1)