제미나이 (인공지능)
본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.
제미나이(Gemini)는 구글 딥마인드가 개발한 멀티모달 대형 언어 모델(LLM)이자 이를 기반으로 하는 인공지능 서비스의 명칭이다. 2023년 12월 6일에 처음 발표되었으며, 기존의 LaMDA와 PaLM 2 모델을 계승한다. 텍스트, 이미지, 오디오, 비디오, 컴퓨터 코드 등 다양한 유형의 데이터를 동시에 처리하고 생성할 수 있는 능력을 갖추고 있다.
개요
제미나이는 구글이 수행한 가장 큰 규모의 과학 및 공학적 결과물로 평가받는 차세대 인공지능 모델이다. 설계 단계부터 멀티모달(Multimodal)로 제작되어 말뭉치뿐만 아니라 시각, 청각 정보를 통합적으로 이해하고 상호작용할 수 있다. 이는 텍스트 데이터 위주로 학습된 기존 모델들과 차별화되는 특징이다.
모델 구성
구글은 사용 목적과 기기 성능에 따라 제미나이를 여러 가지 버전으로 배포한다.
- Gemini Nano: 온디바이스(On-device) 작업에 최적화된 효율적인 모델이다.
- Gemini Flash: 비용 효율적이고 처리량이 높은 변체로, 빠른 응답 속도가 필요한 작업에 사용된다.
- Gemini Pro: 광범위한 작업에 걸쳐 확장 가능한 범용 모델이다.
- Gemini Ultra: 복잡하고 방대한 추론 작업을 수행하기 위해 설계된 최고 성능 모델이다.
- Gemini Deep Think: 고도의 사고 능력이 요구되는 작업을 위한 모델이다.
기술적 특징 및 업데이트
제미나이 1.5 및 3.0 시리즈에서는 확장된 컨텍스트 윈도우를 도입하였다. 이를 통해 대규모 코드베이스, 장편 비디오, 방대한 문서 아카이브를 단일 프롬프트에서 분석할 수 있다. 후속 업데이트는 환각 현상의 감소, 지연 시간 개선, 자율적인 연구 및 소프트웨어 개발을 위한 에이전트 능력 강화에 중점을 두었다.
브랜드 통합
2024년 2월, 구글은 기존의 AI 서비스 브랜드들을 제미나이로 통합하였다. 챗봇 서비스인 '바드(Bard)'는 제미나이로 명칭이 변경되었으며, 구글 클라우드 및 워크스페이스에서 사용되던 'Duet AI' 브랜드 역시 제미나이 식별자로 통합되며 폐지되었다. 안드로이드 기기에서는 모바일 앱을 통해 오버레이 어시스턴트 역할을 수행한다.
평가 및 논란
제미나이는 코딩 및 정보 검색 작업 벤치마크에서 OpenAI의 GPT-4와 경쟁할 만한 수준으로 평가받았다. 그러나 출시 초기 출력 결과의 신뢰성 문제로 비판을 받기도 했다. 특히 2024년 초, 인물 묘사 과정에서 역사적 부정확성과 편향성이 보고되자 구글은 인물 이미지 생성 기능을 일시 중단한 바 있다.