파이썬 taxi-v3 해석하기


파이썬 taxi-v3 해석하기

https://gymnasium.farama.org/ Gymnasium Documentation A standard API for reinforcement learning and a diverse set of reference environments (formerly Gym) gymnasium.farama.org 이번에 연구할 기회가 되어 연구겸 학습해본 taxi-v3 이상하게 한국에서는 예제가 거의 없어서 직접 분석 및 학습해봄 설명: 그리드 세계에는 R(ed), G(reen), Y(ellow) 및 B(lue)로 표시된 네 개의 지정된 위치가 있습니다. 에피소드가 시작되면 택시는 임의의 광장에서 출발하고 승객은 임의의 위치에 있습니다. 택시는 승객의 위치로 이동하여 승객을 태우고 승객의 목적지(지정된 4개 위치 중 다른 하나)로 이동한 다음 승객을 내려줍니다. 승객이 하차하면 에피소드가 종료됩니다. 관찰: 25개의 택시 위치, 5개의 가능한 승객 위치(승객이 택시에 있는 경우 포함...



원문링크 : 파이썬 taxi-v3 해석하기