[인공지능] RL(강화학습) 5강 -Carpole 준비

오늘은 상태가 유한하지 않은 Cartpole을 강화학습 할 것이다. https://gym.openai.com/envs/CartPole-v1/ 카트폴은 쉽게 말해서 좌, 우 컨트롤만으로 연필을 떨어뜨리지 않게 최대한 버티는 문제다. 카트폴에서 환경요소는 총 4개(카트 위치, 카트 속도, 막대 각도, 막대 각속도) 이다. 앞서 다룬 FrozenLake 4x4 경우엔 상태가 16개로 딱 유한하게 정해졌다. 근데 카트폴 상태 가짓수는 사실상 무한하다고 볼 수 있다. 카트 위치만 해도 FrozenLake 처럼 딱딱 떨어지는 이산적인 값이 아니라 연속적인 값인데 속도와 각도는 더 말해 무엇하겠는가? 이런 상태가 무한한 문제에서는 전 강의에서 잠깐 다뤘던 배열로는 예상 보상값을 저장할 수 없..........

[인공지능] RL(강화학습) 5강 -Carpole 준비에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.

원문링크 : [인공지능] RL(강화학습) 5강 -Carpole 준비