[AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)


[AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)

머신러닝 기법 중 하나인, 강화학습에 대해 소개합니다. 강화학습에서 에이전트와 정책, 환경이 무엇을 뜻하는지, 그리고 어떻게 학습하는지를 알아봅니다. [ Contents ] 1. 강화학습이란? 강화학습(Reinforce Learning): 주어진 환경에서 시행착오를 거쳐 최적의 보상을 획득하는 방법(Policy)을 학습 강화학습은 우리가 '운동'을 배우는 것과 비슷합니다. 농구공을 잘 넣기 위해서는, 수많은 시행착오를 거쳐 직접 노하우를 익혀야 합니다. 꾸준한 노력만이 실력을 키울 수 있죠. 강화학습도 이와 마찬가지로, 주어진 환경에서 수많은 시행착오를 거쳐 방법을 터득합니다. 다만, 우월한 컴퓨팅 능력을 통해 굉장히 빠르게 많은 시행착오를 거칩니다. 수도 없이 많은 시뮬레이션을 통해, 컴퓨터는 최적의 ..


원문링크 : [AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)