<sLLM> TinyLlama: An Open-Source Small Language Model (2024.01)

관심있는 NLP 논문을 읽어보고 정리해보았습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ usechatgpt init success [StatNLP Research Group] - 약 1 trillion tokens을 3 epoch 동안 사전학습한 compact 1.1B 언어 모델 - 기존 open-source 언어 모델들(OPT-1.3B, Pythia-1.4B)을 능가하는 성능 1. Introduction 최근 NLP 분야는 언어 모델의 사이즈를 scaling up 하는 방식으로 빠르게 발전하고 있음 이에 따라 한정된 자원을 효율적으로 활용하여 최적의 모델 사이즈와 이에 할당해야 하는 학습 데이터의 양을 정하는 것이 중요한 이슈로 떠오르게 됨 초반에는 모델의 사이즈를 무식하게(..

원문링크 : <sLLM> TinyLlama: An Open-Source Small Language Model (2024.01)

등록된 다른 글

<sLLM> TinyLlama: An Open-Source Small Language Model (2024.01)

등록된 다른 글

첫 채용지원

[Paper Review] BERT - Pre-training of Deep Bidirectional Transformers for Language Understanding

<DB, Agent> [FunSearch] Mathematical discoveries from program search with largelanguage models (2023.12)

[BOJ] 1992 : 쿼드트리 [분할](Python)

<Instruction> WizardCoder: Empowering Code Large Language Models with Evol-Instruct

When changing to the eigenbasis is really useful

[BOJ] 2263 : 트리의 순회 [트리, 분할정복](Python)

Transpose Convolutions, U-Net Architecture Intuition

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티