[인공지능] 강화학습 기법 - 종류와 해당 알고리즘 정리

1. 강화학습 기법이란? - 강화학습 기법은 환경과 상호작용해 얻은 정보를 바탕으로 에이전트의 모델을 업데이트하고, 그 모델을 사용해 에이전트의 정책을 개선하는 것이다. 이후 에이전트는 개선한 정책을 사용하거나 다른 정책을 사용해 환경과 상호작용한다. 환경에서 행동을 취하면 '현재 상태', '행동', '다음 상태'의 상태 전이 정보와 '보상'을 데이터로 얻는다. 그다음은 얻은 데이터를 기반으로 에이전트 내의 모델을 업데이트 한다. 이 모델은 모델기반 강화학습에서 환경의 작동 원리가 될 것이고, 모델프리 강화학습에서는 가치함수나 몬테카를로 방식으로 얻은 보상의 합이 될 것이다. 이렇게 얻은 정보를 처리해 모델을 업데이트한 후 모델을 사용해 정책을 개선한다. 끝으로 개선한 정책 또는 다른 정책을 사용해 환경..

원문링크 : [인공지능] 강화학습 기법 - 종류와 해당 알고리즘 정리

[인공지능] 강화학습 기법 - 종류와 해당 알고리즘 정리

등록된 다른 글

[알고리즘] 백준(baekjoon) 1075번 파이썬

순환 신경망(RNN)을 이용한 주가 예측 (Feat. LSTM)

[알고리즘] 백준 14469 파이썬 - 소가 길을 건너간 이유3

[알고리즘] 백준 2738번 파이썬

데이터 애널리스트 - 업무, 필요 능력, 취업 팁 한번에 정리

[경제] 매도대금담보대출 이란 ? (활용 방법 및 신용 등급)

[Django] 웹 프로그래밍 실습(1) - 페이지 연결하기(View, Templates)

[Python] 파이썬 FinanceDataReader - 미국 ETF 시세 조회

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티