[기술동향] 챗GPT vs 구글 바드 – 이미지 인식과 추론을 누가 더 잘할까?

오픈AI가 챗GPT를 지속적으로 고도화하는 동안 구글 역시 바드의 기능과 성능을 높이고 있다. 여러 가지 변화가 많지만, 특히 최근에 챗GPT와 바드에서 역점을 두고 있는 분야는 아무래도 텍스트와 이미지를 동시에 지원하는 멀티모달로 대표되는 이미지 지원이다. 오늘은 챗GPT와 구글 바드에게 동일한 문제를 내어 이미지 인식과 추론이 어느 정도 수준에 이르렀는지 살펴보겠다. 이미지 인식을 어느 정도 잘하는지 확인하기 위해 텍스트가 아니라 이미지를 사용하고, 추론 능력을 살펴보기 위해 조금 복잡한 조건이 담긴 표를 대상으로 한다. 소득세율을 담고 있는 사진에 포함된 표를 토대로 질문하겠다. [그림] 소득세율을 담고 있는 사진] [라운드 1] “공제금액이나 다른 공제 항목을 적용하지 않은 상황에서 연봉 1500만 원인 사람이 내야 할 소득세를 계산해 줘” 최근 업데이트된 챗GPT-4의 경우에는 언어로 중간 과정을 표현하는 방식에 대한 보완 설명을 위해, [>_] 버튼을 누를 경우 파이썬 코...

#LLM #거대언어모델 #구글바드 #기술동향 #레인보우브레인 #이미지인식추론 #챗지피티

원문링크 : [기술동향] 챗GPT vs 구글 바드 – 이미지 인식과 추론을 누가 더 잘할까?