AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

AI가 수학 올림피아드 금메달을 획득하다: OpenAI와 Google이 보여준 추론 AI의 새로운 지평

2025년 7월, AI 역사에 기록될 만한 일이 일어났습니다. OpenAI와 Google DeepMind의 AI 모델이 동시에 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 거두었다고 발표했습니다. 이는 AI가 인간 수준의 복잡한 수학적 추론 능력을 보여준 첫 번째 사례로, AI 발전사에 중요한 이정표가 되었습니다.

Google DeepMind의 IMO 2025 성과 발표 자료 (출처: Google DeepMind)

OpenAI의 실험적 추론 모델, 예상을 뛰어넘다

OpenAI의 연구원 Alexander Wei는 트위터를 통해 자사의 실험적 추론 모델이 IMO에서 6문제 중 5문제를 해결하여 42점 만점에 35점을 획득했다고 발표했습니다. 이 모델은 인간 참가자와 동일한 조건에서 평가받았습니다. 4.5시간의 시간 제한, 외부 도구나 인터넷 접근 금지, 그리고 상세한 증명 과정 작성까지 모든 조건이 동일했습니다.

Wei는 “IMO 문제들은 지속적인 창의적 사고의 새로운 수준을 요구한다”며, 이번 성과가 “범용 강화학습과 테스트 시간 컴퓨팅 스케일링”의 진전을 보여준다고 설명했습니다. 특히 AI가 해결할 수 있는 수학 문제의 복잡도가 급격히 상승했다는 점을 강조했습니다. GSM8K(0.1분) → MATH 벤치마크(1분) → AIME(10분) → IMO(100분)로 이어지는 발전 과정을 거쳐 마침내 최고 난이도에 도달한 것입니다.

더 흥미로운 소식은 GPT-5의 임박한 출시 소식입니다. Wei는 “곧 GPT-5를 출시할 예정”이라고 밝혔으며, 업계 전문가들은 GPT-5가 단일 모델이 아닌 추론, 비추론, 도구 사용에 특화된 여러 모델의 시스템으로 구성될 것이라고 예측하고 있습니다.

Google DeepMind의 Gemini Deep Think, 공식 인증 획득

Google DeepMind는 한 걸음 더 나아가 IMO 주최측으로부터 공식 인증을 받았습니다. Gemini Deep Think의 향상된 버전이 OpenAI와 동일하게 5문제를 완벽히 해결하여 35점을 획득한 것입니다. IMO 회장 Gregor Dolinar 교수는 “Google DeepMind가 42점 만점에 35점이라는 금메달 점수에 도달했음을 확인한다”며 “그들의 솔루션은 여러 면에서 놀라웠고, 명확하고 정확하며 대부분 따라하기 쉬웠다”고 평가했습니다.

출처: Google DeepMind

특히 주목할 점은 기술적 접근법의 혁신입니다. 작년 AlphaProof와 AlphaGeometry 2는 전문가가 자연어를 Lean과 같은 도메인 특화 언어로 번역해야 했고, 계산에 2-3일이 소요되었습니다. 반면 올해 Gemini Deep Think는 자연어로 된 공식 문제 설명을 직접 읽고 4.5시간 경쟁 시간 내에 엄밀한 수학적 증명을 자연어로 작성했습니다.

추론 AI의 패러다임 전환

이번 성과는 단순한 기술적 진보를 넘어 AI 추론 능력의 패러다임 전환을 의미합니다. Deep Think는 “병렬 사고”라는 새로운 기법을 통해 선형적인 사고 체인이 아닌 여러 가능한 해결책을 동시에 탐색하고 결합하는 방식으로 작동합니다. 이는 인간의 창의적 문제 해결 과정과 유사한 접근법입니다.

더 나아가 두 회사 모두 이러한 추론 능력이 수학을 넘어 과학, 공학, 연구 분야 전반에 걸쳐 활용될 수 있을 것이라고 전망하고 있습니다. Google DeepMind는 “수학자, 과학자, 엔지니어, 연구자들에게 무가치한 도구가 될 것”이라며 AGI로 가는 길에서 인간 지식 발전에 기여할 것이라고 밝혔습니다.

수학 문제 해결
AI가 복잡한 수학 문제를 해결하는 새로운 시대가 열렸습니다 (출처: Unsplash)

우리에게 미치는 영향

이번 IMO 금메달 달성은 AI가 단순한 계산을 넘어 창의적이고 복합적인 사고가 필요한 영역에서도 인간 수준에 근접했음을 보여줍니다. 교육 분야에서는 개인 맞춤형 수학 튜터링이 가능해질 것이며, 연구 분야에서는 복잡한 이론 증명과 가설 검증에 AI가 활용될 수 있을 것입니다.

곧 출시될 GPT-5와 공개 예정인 Gemini Deep Think는 이러한 고도의 추론 능력을 일반 사용자들도 접할 수 있게 만들 것입니다. AI가 인간의 지적 파트너로서 더욱 정교하고 창의적인 역할을 담당하는 시대가 본격적으로 시작된 셈입니다.


참고자료:

Comments