Attention이란?-원리부터 masking까지 (General Luong Attention을 기반으로)

지난 게시글에서 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)를 알아보았다. 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)란? - 기본 구조편 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)는 입력된 시퀀스로부터 다른 도메인의 시퀀스를 출력하는 모델이다. 기계번역, 챗봇, text summarization 등 다양한 분야에서 사용되지만, 모델 자체의 이해 gbdai.tistory.com 그러나, 이러한 RNN 기반의 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)(Sequence-to-Sequence, seq2seq)에는 다음과 같은 문제가 있다. hidden state에 정보를 저장하는데, capac..

원문링크 : Attention이란?-원리부터 masking까지 (General Luong Attention을 기반으로)

Attention이란?-원리부터 masking까지 (General Luong Attention을 기반으로)

등록된 다른 글

[Go] Go에서의 변수

[JavaScript] 자바스크립트의 데이터 타입

[선형대수학] Gauss-Jordan elimination(가우스-요르단 소거법)과 Solution of linear system

[논문 리뷰] RoBERTa: A Robustly Optimized BERT Pretraining Approach - RoBERTa

[자료구조] 큐(Queue)의 개념과 구현(2)

[선형대수학] Orthogonality(직교성)

[선형대수학] Linear Equation(일차방정식)

[Python] 함수 인트로스펙션(Function Introspection)과 매개변수(Function Parameter), 애너테이션(Function Annotation)

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티