<Benchmark> [MMHAL-BENCH] Aligning Large Multimodal Models with Factually Augmented RLHF

최근(2023.09)에 나온 (accept 전 preprint)논문을 읽어보고 간단히 정리했습니다. 혹시 부족하거나 잘못된 내용이 있다면 댓글 부탁드립니다 ️ usechatgpt init success [Microsoft, MIT] (Factually Augmented) RLHF를 vision-language alignment에 적용. GPT-4를 이용하여 vision instruction tuning을 위한 데이터셋 확보. hallucination 수준을 파악하는 MMHAL-BENCH 개발. 배경 LLM의 부상과 함께 Large Multimodal Model(LMM) 역시 대규모의 image-text pair 데이터에 대한 사전학습을 바탕으로 큰 주목을 받기 시작했습니다. 그러나 multimoda..

원문링크 : <Benchmark> [MMHAL-BENCH] Aligning Large Multimodal Models with Factually Augmented RLHF

<Benchmark> [MMHAL-BENCH] Aligning Large Multimodal Models with Factually Augmented RLHF

등록된 다른 글

Making Multiple Mappings, deciding if these are reversible

Non-linear regression

[Short Paper Review] PaLM2 Technical Report

Google Cloud Platform(GCP) VM 인스턴스/버킷 생성하기, CLI로 파일 업로드/다운로드 하기

<LK Lab, CoT> The CoT Collection: Improving Zero-shot and Few-shot Learning of Language MOdels via Chain-of-Thought Fine-Tuning (2023.10)

What are eigen-things?

Logistic Regression as a Neural Network(2)

[비전공자 취업 회고록] 영어영문학 전공자가 데이터 사이언티스트가 되기까지는 1년이 걸렸다(feat. 비전공자인데 개발자 해도 될까요?)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티