구글이 18일 최신 AI(인공지능) 모델 '제미나이 3 플래시(Gemini 3 Flash)'를 공개했다.
구글은 속도에 최적화된 최첨단 인텔리전스 모델로, 제미나이 3 프로(Pro)급 추론 성능을 유지하면서 플래시(Flash) 수준의 속도와 효율성을 동시에 구현하는 것이 특징이라고 밝혔다.
앞서 제미나이 3를 통해 복잡한 추론, 멀티모달 및 시각적 이해(vision understanding), 그리고 에이전틱 및 바이브 코딩 작업 전반에서 최첨단 성능을 선보인 구글은 이번 제미나이 3 플래시 모델에서 기존 제미나이 3의 성능은 유지하되, 짧은 지연 시간(latency), 효율성 및 경제성을 결합했다.
이 모델은 박사(PhD) 수준의 추론 및 지식 벤치마크[GPQA Diamond(90.4%) 및 Humanity's Last Exam(툴 미사용 기준 33.7%)]에서 대규모 최첨단 모델에 필적하는 성능을 제공한다. 또 종합멀티모달 추론테스트(MMMU Pro)에서 81.2%를 달성해 최고 수준(SOTA:state-of-the-art)의 성능을 달성했다. 제미나이 3 프로와 대등한 수준이다.
아울러 가장 높은 수준의 사고(thinking) 과정에서 사고의 양을 스스로 조절, 비용 대비 속도와 효과 모두 최적화한다. 트래픽 측정 결과 일상적인 작업을 수행할 때 제미나이 2.5 프로 대비 평균 30% 적은 토큰을 사용하면서도 더 높은 성능으로 정확한 결과를 제공한다는 것이 구글 측 설명이다.
모델명 '플래시'에서 유추할 수 있듯 속도는 이전 모델보다 더 빠르지만, 비용은 더 낮다. 속도 벤치마크(Artificial Analysis) 기준 제미나이 2.5 프로보다 3배 빠른 속도를 구현하면서도 비용은 훨씬 낮았다. 입력 토큰 100만개에 0.5달러, 출력 토큰 100만개에 3달러다. (오디오는 100만개당 1달러)
이를 통해 구글은 제미나이3 플래시가 일상적인 작업의 추론 능력을 향상시킬 것이라고 기대했다.