[AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)

머신러닝 기법 중 하나인, 강화학습에 대해 소개합니다. 강화학습에서 에이전트와 정책, 환경이 무엇을 뜻하는지, 그리고 어떻게 학습하는지를 알아봅니다. [ Contents ] 1. 강화학습이란? 강화학습(Reinforce Learning): 주어진 환경에서 시행착오를 거쳐 최적의 보상을 획득하는 방법(Policy)을 학습 강화학습은 우리가 '운동'을 배우는 것과 비슷합니다. 농구공을 잘 넣기 위해서는, 수많은 시행착오를 거쳐 직접 노하우를 익혀야 합니다. 꾸준한 노력만이 실력을 키울 수 있죠. 강화학습도 이와 마찬가지로, 주어진 환경에서 수많은 시행착오를 거쳐 방법을 터득합니다. 다만, 우월한 컴퓨팅 능력을 통해 굉장히 빠르게 많은 시행착오를 거칩니다. 수도 없이 많은 시뮬레이션을 통해, 컴퓨터는 최적의 ..

원문링크 : [AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)

[AI/RL] 강화학습(Reinforce Learning)이란? 에이전트(Agent)와 정책(Policy), 환경(Environments)

등록된 다른 글

[구현/수학] 백준 6840 Who is in the middle? - 파이썬(Python)

[Python] 주피터 노트북(Jupyter Notebook) 다운로드/설치방법 (아나콘다 이용)

[구현/수학] 백준 24072 帰省 (Homecoming) - 파이썬(Python)

[구현/문자열] 백준 6996 애너그램 - 파이썬(Python)

[수학/브루트포스] 백준 6131 완전 제곱수 - 파이썬(Python)

[SW공학] 소프트웨어 아키텍처: MVC, 이벤트 기반, 파이프 필터

[구현/수학] 백준 13240 Chessboard - 파이썬(Python)

[구현/문자열] 백준 21598 SciComLove - 파이썬(Python)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티