[강화학습-RL]#3 Monte carlo Method

#Reinforcement #Learning #Montecarlo #Simulation #Method #화공공대생 안녕하세요. 화공공대생 입니다. 오늘은 몬테카를로 방법에 대한 내용으로 소개드려보고자 합니다. 이전 Dynamic program에서는 State Transition probability가 주어진 상태에서 문제를 해결할 수 있었습니다. MDP 문제는 정해진 이율이나 어느정도 트렌드의 변화가 있는 것들에 대해서 쉽게 적용이 가능합니다. 하지만, 실제 문제에서는 이 Probability를 알 수 가 없는 상태가 많죠. 몬테카를로 문제는 이러한 문제를 보완 하기 위해 나타난 방법입니다. 사실 이 방법론은 도박장에서 나타나긴 했지만요.. Monte Carlo method Monte Carlo method를 가지고 우리는 Epis..........

원문링크 : [강화학습-RL]#3 Monte carlo Method

등록된 다른 글

[강화학습-RL]#3 Monte carlo Method

등록된 다른 글

[통계] 평균, 분산, 공분산, 이항분포

[대전 봉명동 맛집 ] 정통집

Diffusion,Mass Transfer(확산,물질전달, Fick's 법칙, Random walk, Mean free path)-기체편

[가스기사] #3 가스설비

[블챌] 뚜벅이 휴가 10월, 서울-평창, 평창-강릉, 올림픽 공원

[통계]#3 Error(Lack of fit, F-test)

[최적화] #6 1차, 2차 미분가능에 따른 Theorem,방향도함수, Local, global minmum의 수학적 표현.

[유체역학] 회전운동, 각운동량보존 ( 토크, 터빈,펌프, 증기 터빈 싸이클)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티