<Alignment> RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

최근(2023.09)에 나온 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ usechatgpt init success [Google Research] LLM을 요약 태스크에 대해 학습시킬 때 반영하는 '사람'의 선호 대신 'AI'의 선호를 반영하는 RLAIF 배경 ChatGPT와 같은 LLM들이 주목을 받게 된 데 가장 큰 기여를 한 것은 RLHF(Reinforcement Learning with Human Feedback)이라고 해도 과언이 아닐 것입니다. reward 모델이 사람의 선호를 학습하고, 이를 바탕으로 언어 모델을 추가 학습하는 방식입니다. 그런데 이러한 방식 역시 사람의 선호를 나타낼 수 있는 pair 데이터셋이 필요하기 때문에, L..

원문링크 : <Alignment> RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

등록된 다른 글

<Alignment> RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

등록된 다른 글

[프로그래머스] 옹알이 (2)(Python)

<RAG, Refinement> [CRAG] Corrective Retrieval Augmented Generation (2024.01)

Face Recognition(5) : Face Verification and Binary Classification

[BOJ] 1149 : RGB거리 [다이나믹 프로그래밍](Python)

F1 Score, Confusion Matrix, Precision & Recall (trade-off) 왕초보를 위한 설명

<LoRA, MoE> LoRAMoE: Revolutionizing Mixture of Experts for Maintaining World Knowledge in Language Model Alignment (2023.12)

<Retrieval> [RAG] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (2021.04)

[프로그래머스] 추억 점수 (Python)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티