Deepracer 전이학습

딥 러닝 기반 자율주행 모형 자동차인 딥레이서의 현실세계 주행 모델을 위해 기존 아마존 aws시뮬레이터에서 훈련한 모델을 적용하였으나 만족할만한 성과를 내지못함. 위 사진은 기존 모델의 트레이닝 reward 결과이며 해당 모델은 시뮬레이션 환경에서 트랙을 이탈하지 않고 주행함. 하지만 실세계 모델에서 채 한바퀴를 돌지 못하고 트랙을 이탈하는 모습이 보여 해당 모델을 강화학습 하여 실 세계 모델에 적용할 계획으로 아래와 같이 학습을 진행. 보상함수 그래프는 대체로 수렴하는 모습 강화학습 하는 방법은 기존 모델을 클론 clone 하는 방법으로 진행 기존 모델에 들어가 action tab을 보면 clone tab이 존재하며 이를 클릭하면 기존 모델 create와 같은 방법으로 모델을 만들 수 있다. 하이퍼파라미터와 보상함수 훈련시킬 맵 또한 변경이 가능 강화학습의 결과는 동영상과 같이 트랙을 이탈하지 않고 주행하는 모습을 보임. 영상은 2배속 환경...

#deepracer #강화학습 #딥레이서 #보상함수 #자율주행

원문링크 : Deepracer 전이학습