[강화학습-RL] #1 Introduction, Markov, Greedy


[강화학습-RL] #1 Introduction, Markov, Greedy

#강화학습 #Reinforcement #Learning #Introduction #Markov #Greedy #화공공대생 안녕하세요. 화공공대생입니다. 오늘은 머신러닝 중 강화 학습에 대하여 다루겠습니다. (전통 화공도 다룰게 엄청 많이 남았는데 ㅠㅠ 졸준때문에 너무 소홀해지고 있습니다..) 오늘의 키워드는 MDP (Markov Decision Process)입니다. 이외에 간단한 용어에 대하여 설명드리겠습니다. Process가 들어간 이유는 확률 기반의 알고리즘이어서 그렇겠죠 ㅎㅎ? 먼저 머신러닝이 여러 가지 종류가 있는데, 대충 알아보겠습니다. 각각의 Learning 하는 방식이 다르다고 볼 수 있습니다. Supervised Supervised는 미리 정보에 대해서 알려준 뒤 학습을 시킵니다. 이 뒤에..........



원문링크 : [강화학습-RL] #1 Introduction, Markov, Greedy