구글 딥마인드의 새로운 모델 제미니의 등장

2023. 7. 7. 17:45인공지능 개요

반응형

 

데미스 하사비스가 만드는 새로운 챗봇

 

제미니는 텍스트와 이미지가 함께 작동하는 대형언어모델(LLM)입니다. 제미니는 알파고에 사용된 인간의 피드백을 기반으로 한 강화학습(RL), 트리 검색(Tree Search) 등의 기반 기술과 LLM의 놀라운 언어 능력을 결합한 것입니다. 제미니는 GPT-4보다 더 강력한 LLM이며, 다양한 작업을 수행할 수 있습니다. 예를 들어, 제미니는 텍스트를 생성하고, 언어를 번역하고, 다양한 종류의 창의적인 콘텐츠를 작성하고, 유익한 방식으로 질문에 답변할 수 있습니다.

 

새로운 챗봇인 제미니는 ChatGPT를 구동하는 GPT-4와 본질적으로 유사하지만, 제미니는 알파고에 사용된 인간의 한계를 초월하고 인간의 피드백을 기반으로 한 강화학습(RL), 트리 검색(Tree Search) 등의 기반 기술과 LLM의 놀라운 언어 능력을 결합한 것입니다. 제미니는 시스템에 계획이나 문제 해결 능력과 같은 새로운 기능을 부여하는 것을 목표로 하고 있습니다.

특히, 제미니는 이미지 생성 및 인식 기능을 추가한 멀티모달입니다. 구글은 자사의 다양한 플랫폼을 연동해 마이크로소프트 365 코파일럿(Microsoft 365 Copilot-참고)에 대항하는 서비스를 내놓을 것으로 보입니다.

하사비스는 "제미니는 아직 개발 중이며, 몇 달이 걸릴 것"이라며, "이는 수천만 달러에서 수억 달러의 비용이 들 수도 있다"고 밝혔습니다. OpenAI의 CEO인 샘 알트먼은 지난 4월에 GPT-4를 만드는 데 1억 달러 이상이 들었다고 밝혔습니다.

한편, 챗GPT가 지난해 11월 출시된 이후 구글은 인공지능 챗봇인 바드(참조)를 지난 3월 서둘러 출시하고 검색 엔진과 기타 여러 제품에 제너레이티브 AI를 도입했습니다. 특히, 지난 4월 20일, 구글의 두 개의 선도적인 인공지능 연구 그룹인 구글 리서치(Google Research)의 '브레인(Brain)' 팀과 구글 딥마인드를 새로운 하나의 집중된 팀. '구글 딥마인드(Google DeepMind)'로 통합(참조)하고 AI의 발전을 가속하고 있습니다.

 

제미니와 바드는 모두 대규모 언어 모델(LLM)이지만, 몇 가지 중요한 차이점이 있습니다.

제미니는 이미지 생성 및 인식 기능을 추가한 멀티모달입니다. 바드는 텍스트만 처리할 수 있습니다.
제미니는 알파고에 사용된 인간의 한계를 초월하고 인간의 피드백을 기반으로 한 강화학습(RL), 트리 검색(Tree Search) 등의 기반 기술과 LLM의 놀라운 언어 능력을 결합한 것입니다. 바드는 LLM의 놀라운 언어 능력만을 가지고 있습니다.
이러한 차이로 인해 제미니는 바드보다 더 강력한 기능을 가지고 있습니다. 예를 들어, 제미니는 이미지를 생성하거나 이미지를 인식할 수 있습니다. 바드는 이러한 기능을 수행할 수 없습니다. 또한, 제미니는 알파고에 사용된 인간의 한계를 초월하고 인간의 피드백을 기반으로 한 강화학습(RL), 트리 검색(Tree Search) 등의 기반 기술을 가지고 있습니다. 이러한 기반 기술은 제미니가 바드보다 더 강력한 기능을 수행할 수 있도록 도와줍니다.

그러나 제미니는 아직 개발 중이며, 바드는 이미 출시되어 있습니다. 따라서 바드는 제미니보다 더 많은 기능을 제공하고 있습니다. 예를 들어, 바드는 제미니보다 더 많은 종류의 텍스트를 생성하고, 더 많은 종류의 언어를 번역할 수 있습니다. 또한, 바드는 제미니보다 더 많은 종류의 창의적인 콘텐츠를 작성할 수 있습니다.

전반적으로 제미니는 바드보다 더 강력한 기능을 가지고 있지만, 아직 개발 중입니다. 바드는 제미니보다 더 많은 기능을 제공하고 있지만, 제미니만큼 강력하지는 않습니다.

 


통합된 구글의 새로운 AI 조직 '구글 딥마인드'는 데미스 하사비스가 이끌고 있습니다.

반응형