<CoT, Agent> ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent (2023.12)

관심있는 NLP 논문을 읽어보고 ChatGPT를 이용하여 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ Abstract usechatgpt init success [Google Research, Google DeepMind] 주요 내용: 복잡한 자연어 질문에 답하기 위해 다단계 추론과 외부 정보 통합이 필요합니다. 이를 위해 대규모 언어 모델(LLM)과 지식 검색을 결합한 시스템이 개발되었으나, 이들 시스템은 다양한 실패 사례를 겪고 있습니다. 문제점: 이러한 시스템들은 외부 지식과의 상호작용이 비차별화(non-differentiable)되기 때문에 직접 end-to-end로 훈련시켜 실패를 수정할 수 없습니다. 해결 방안: 이를 해결하기 위해 외부 지식에 대해 추론하고 ..

원문링크 : <CoT, Agent> ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent (2023.12)

<CoT, Agent> ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent (2023.12)

등록된 다른 글

TOEIC/TEPS 동시 준비 2주 만에 955/409점 달성한 후기

Special matrices and Coding up some matrix operations

Programming Assignments

The sandpit game

HTML 찍먹은 여기까지..!

Python and Vectorization(2)

<LLM> [MoE] Mixtral of Experts (2024.01)

2022(상) 삼성전자 DX SCSA 전형, 서류 합격후기

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티