
수학 논문의 미묘한 논리적 결함을 찾아내거나, 반도체 물질의 성장 레시피를 최적화하는 작업은 AI가 잘하기 어려운 영역이었습니다. 명확한 정답이 없고 데이터도 불완전하죠. Google이 Gemini 3 Deep Think를 대폭 업그레이드하며 과학, 연구, 엔지니어링 분야의 까다로운 문제들을 해결하는 데 집중한 이유입니다.
출처: Gemini 3 Deep Think: AI model update designed for science – Google AI Blog
학술 벤치마크에서 새로운 기록
업데이트된 Deep Think는 가장 엄격한 학술 벤치마크에서 놀라운 성과를 냈습니다. Humanity’s Last Exam에서 48.4%를 기록했고, ARC-AGI-2에서는 84.6%라는 전례 없는 점수를 달성했습니다. Codeforces에서는 3455 Elo를 기록했으며, 2025 국제수학올림피아드에서 금메달 수준의 성적을 보였죠.
수학과 코딩을 넘어 화학과 물리학 같은 광범위한 과학 영역에서도 뛰어납니다. 2025 국제물리올림피아드와 화학올림피아드 필기 섹션에서 금메달 수준의 결과를 냈고, CMT-Benchmark에서는 50.5%를 기록하며 고급 이론물리학에서의 역량을 입증했습니다.
실제 연구 현장에서 이미 활약 중
Rutgers 대학의 수학자 Lisa Carbone은 고에너지 물리학 커뮤니티를 위한 수학적 구조를 연구합니다. 훈련 데이터가 거의 없는 분야인데, Deep Think를 사용해 고도로 기술적인 수학 논문을 검토했습니다. 그 결과 인간 동료 평가에서 발견되지 않았던 미묘한 논리적 결함을 성공적으로 찾아냈죠.
Duke 대학의 Wang Lab은 반도체 물질 발견을 위해 복잡한 결정 성장 제작 방법을 최적화하는 데 Deep Think를 활용했습니다. 기존 방법으로는 달성하기 어려웠던 100μm 이상의 박막을 성장시키는 레시피를 성공적으로 설계했습니다.
Google의 플랫폼 및 디바이스 부문 R&D 책임자 Anupam Pathak은 물리적 구성요소 설계를 가속화하는 데 Deep Think를 테스트했습니다. 이처럼 Deep Think는 이미 다양한 분야의 전문가들에게 실질적인 도움을 주고 있습니다.
깊은 과학 지식과 일상적 엔지니어링 유틸리티의 결합
Google은 과학자와 연구자들과 긴밀히 협력하며 Deep Think를 업데이트했습니다. 연구 문제는 종종 명확한 가이드라인이나 단일한 정답이 없고, 데이터도 지저분하거나 불완전한 경우가 많습니다. Deep Think는 깊은 과학 지식과 일상적인 엔지니어링 유틸리티를 결합해, 추상적인 이론을 넘어 실용적인 응용으로 나아갑니다.
예를 들어 스케치를 3D 프린팅 가능한 현실로 바꿀 수 있습니다. Deep Think가 그림을 분석하고 복잡한 형태를 모델링한 뒤, 3D 프린터로 실제 물체를 만들 수 있는 파일을 생성하는 식이죠.
Google AI Ultra 구독자는 오늘부터 Gemini 앱에서 업데이트된 Deep Think 모드에 접근할 수 있습니다. 과학자, 엔지니어, 기업은 조기 접근 프로그램을 통해 Gemini API로 Deep Think를 테스트할 수 있습니다.

답글 남기기