[Short Paper Review] Learning to Compress Prompts with Gist Tokens

최근에 나온 논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ 프롬프트를 Gist(요점) 토큰에 압축함으로써 모델의 태스크 처리 시간을 단축하고 메모리 효율성을 높일 수 있다. 배경 최근 LM(Language Model)을 활용하는 주된 방법 중 하나는 모델에 prompt를 제공하고 모델이 반환하는 answer를 사용하는 것이다. 태스크나 여러 상황에 따라 적절한 프롬프트를 구성하는 전략이 중요해졌고, 심지어 프롬프트 엔지니어라는 이름의 새직종이 생겨날만큼 많은 관심을 받고 있다. 그러나 모델이 입력으로 받을 수 있는 길이에 제한이 존재한다는 점을 감안하면, 길이가 꽤 되는 프롬프트를 반복적으로 사용하는 것은 꽤나 치명적인 문제가 될 수 있다. 본 논문..

원문링크 : [Short Paper Review] Learning to Compress Prompts with Gist Tokens

[Short Paper Review] Learning to Compress Prompts with Gist Tokens

등록된 다른 글

4.7. 대각화할 수 없는 경우

5.3. 거듭제곱의 원리

<LLM> Llama 2: Open Foundation and Fine-Tuned Chat Models

[Short Paper Review] ResiDual: Transformer with Dual Residual Connections

Back to basics: functions

<Retrieval, In-Context Learning> RAVEN: In-Context Learning with Retrieval Augmented Encoder-Decoder Language Models

Logistic Regression as a Neural Network(1)

<LLM, Code> [OSS-Instruct] Magicoder: Source Code Is All You Need (2023.12)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티