[아이티비즈 김아라 기자] 구글은 19일 멀티모달 이해·추론 능력을 대폭 강화한 차세대 인공지능(AI) 모델 ‘제미나이 3(Gemini 3)’를 공개했다.
제미나이 3는 멀티모달 이해 능력에 있어 세계 최고 수준의 성능을 제공하며, 지금까지 구글이 선보인 모델 중 가장 강력한 에이전트이자 '바이브 코딩(vibe coding)' 기능을 갖춘 모델이다. 최첨단 추론 능력을 기반으로 더 풍부한 시각적 결과물과 심화된 상호작용을 구현한다.
순다 피차이 구글 및 알파벳 CEO는 "약 2년 전, 구글 역사상 가장 야심찬 과학적 도전과 제품 혁신 중 하나인 제미나이 시대의 서막을 열었다. 그 이후 제미나이에 대한 호응은 뜨거웠다. 현재 매달 20억 명이 'AI 개요(AI Overviews)'를 이용하고 있으며, 제미나이 앱의 월간 활성 이용자는 6억 5천만 명을 넘어섰다. 또한 구글 클라우드 고객의 70% 이상이 구글의 AI를 활용하고 있고, 1천 3백만 명의 개발자가 구글의 생성형 AI 모델을 기반으로 개발을 진행하고 있다. 그리고 이는 지금 우리가 목격하고 있는 변화의 일면에 불과하다"고 말했다.
또 피차이 CEO는 "제미나이는 세대를 거듭할수록 이전 모델의 강점을 토대로 발전하며 이용자에게 더 많은 가능성을 열어 줬다. 제미나이 1은 네이티브 멀티모달(Native Multimodal) 기능과 장문의 정보를 이해할 수 있는 긴 컨텍스트 윈도우(long context window)의 진보를 통해 처리할 수 있는 정보의 범위와 형태를 획기적으로 확장했고, 제미나이 2는 에이전트 기능(Agentic capabilities)의 기반을 마련하고 복잡한 사고와 추론 능력의 한계를 넓혔다"고 설명했다.
그리고 이번에 모든 제미나이의 역량을 집대성해 어떤 아이디어든 실현할 수 있도록 돕는 가장 똑똑한 모델, 제미나이 3이 선보였다.
제미나이 3는 창의적인 아이디어 속 미묘한 단서를 포착하거나, 복잡한 문제를 여러 겹의 층위로 나눠 풀어낼 수 있는 등 전례 없는 수준의 깊이와 뉘앙스를 이해할 수 있도록 설계된 최첨단 추론 능력을 갖췄다. 또 요청의 컨텍스트와 의도를 보다 정확하게 파악해 최소한의 프롬프트로도 원하는 결과를 얻을 수 있다. 불과 2년 만에 AI가 단순히 텍스트와 이미지를 읽는 데서 나아가 '분위기를 파악하는(reading the room)' 수준으로 진화한 것이다.
그리고 오늘부터 구글 전반에 걸쳐 제미나이를 전면 적용한다. 이는 더 복잡한 추론 기능과 새로운 동적 경험을 갖춘 구글 검색의 AI 모드(AI Mode in Search)에 있는 제미나이 3를 포함한다. 서비스 출시 첫날부터 제미나이 모델을 검색에 적용하는 경우는 이번이 처음이다. 제미나이 3는 제미나이 앱, AI 스튜디오(AI Studio) 및 버텍스 AI(Vertex AI)의 개발자 툴, 그리고 새로운 에이전트 개발 플랫폼인 '구글 안티그래비티(Google Antigravity)'에도 적용된다.
피차이 CEO는 "제미나이 3는 이전 세대 모델들과 마찬가지로 다시 한 번 기술의 한계를 넘어서고 있다. 이번에도 구글은 새로운 챕터를 열어 지능, 에이전트, 개인화의 한계를 지속적으로 확장해 나가며 모든 사람에게 진정으로 유용한 AI를 만들 것이다"고 강조했다.
