[AI 게이머] 강화학습으로 배스킨라빈스 필승법 공략하기

이번에는 배스킨라빈스 게임이다. 가위바위보 때와는 달리 머신러닝 기법을 사용하여 새가리에게 학습을 하도록 만들었다. 배스킨라빈스 게임을 1:1로 진행한다면, 선 플레이어에게는 필승법이 존재한다. 이 필승법을 깨우칠 수 있도록 새가리에게 강화학습의 Q-Learning을 사용하여 학습을 진행하였으며, Q-Learning에 대한 기본적인 원리는 아래의 링크를 참고하면 된다. [게임으로 배우는] LOL로 배우는 강화학습 Q-Learning 내 티어는 왜 낮은 걸까? 원인을 따져보면 피지컬 문제, 라인 관리 능력 부족, 좁은 시야 등 여러 가지가 ... blog.naver.com 게임 방법은 숫자 1부터 시작해서 플레이어들이 차례대로 한 번에 세 개의 숫자를 외칠 수 있다. 이때 숫자 31을 외치는 사람이 게임에서 패배하게 된다. 상태는 새가리가 시작할 숫자의 바로 직전의 숫자, 즉 상대방이 마지막으로 외친 숫자로 정의했다. 따라서 다음 상태는 다음에 상대방이 마지막으로 외친 숫자가 된다. ...

#AI #AI게이머 #게임하는AI #배스킨라빈스게임 #인공지능

원문링크 : [AI 게이머] 강화학습으로 배스킨라빈스 필승법 공략하기