[강화학습-RL]#3 Monte carlo Method


[강화학습-RL]#3 Monte carlo Method

#Reinforcement #Learning #Montecarlo #Simulation #Method #화공공대생 안녕하세요. 화공공대생 입니다. 오늘은 몬테카를로 방법에 대한 내용으로 소개드려보고자 합니다. 이전 Dynamic program에서는 State Transition probability가 주어진 상태에서 문제를 해결할 수 있었습니다. MDP 문제는 정해진 이율이나 어느정도 트렌드의 변화가 있는 것들에 대해서 쉽게 적용이 가능합니다. 하지만, 실제 문제에서는 이 Probability를 알 수 가 없는 상태가 많죠. 몬테카를로 문제는 이러한 문제를 보완 하기 위해 나타난 방법입니다. 사실 이 방법론은 도박장에서 나타나긴 했지만요.. Monte Carlo method Monte Carlo method를 가지고 우리는 Epis..........



원문링크 : [강화학습-RL]#3 Monte carlo Method