AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

DeepSeekMath-V2, IMO 2025 금메달 달성한 수학 AI를 오픈소스로 공개

세계 최고 수학자의 두뇌를 공짜로 소유할 수 있다면 어떨까요? 중국 AI 연구소 DeepSeek이 OpenAI, Google에 이어 국제수학올림피아드(IMO) 2025에서 금메달 수준의 성적을 달성한 수학 AI 모델 DeepSeekMath-V2를 오픈소스로 공개했습니다. 단순히 정답을 맞추는 것을 넘어 증명 과정의 엄밀성까지 검증하는 혁신적인 접근법으로, AI 수학 능력의 새로운 기준을 제시하고 있습니다.

사진 출처: DeepSeek GitHub

DeepSeek이 공개한 DeepSeekMath-V2는 IMO 2025에서 6문제 중 5문제를 해결하며 금메달 수준을 달성했습니다. 올해 7월 OpenAI와 Google DeepMind의 모델도 같은 성적을 기록했지만, DeepSeek의 차별점은 이 모델을 완전히 오픈소스로 공개했다는 점입니다. Hugging Face CEO 클레망 들랑그는 “세계 최고 수학자의 두뇌를 공짜로 소유하는 것”이라며 “현재 IMO 2025 금메달리스트 수준 모델에 접근할 수 있는 챗봇이나 API는 없다”고 말했습니다.

출처: DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning – DeepSeek AI

정답보다 중요한 것: 엄밀한 증명

DeepSeek은 기존 AI 모델들이 가진 근본적인 한계를 지적합니다. 최근 AI들은 수학 벤치마크에서 정답을 잘 맞추지만, 추론 과정이 엉망인 경우가 많다는 것이죠. “많은 수학 과제, 특히 정리 증명은 숫자 답이 아니라 엄밀한 단계별 도출을 요구합니다. 이런 경우 최종 답만 보상하는 방식은 적용할 수 없습니다.”

DeepSeekMath-V2의 핵심은 자체 검증(self-verification) 메커니즘입니다. 연구팀은 두 가지 모델을 따로 훈련시켰어요. 하나는 증명을 생성하는 모델, 다른 하나는 그 증명의 품질을 평가하는 검증 모델입니다. 생성 모델은 자신의 실수를 발견하고 고칠 때만 보상을 받습니다. 단순히 실수를 감추는 것으로는 안 되죠.

더 흥미로운 건 이 시스템이 스스로 진화한다는 점입니다. 검증 모델이 생성 모델의 증명을 평가하면서, 특히 검증하기 어려운 증명들을 자동으로 라벨링해 새로운 훈련 데이터를 만듭니다. 생성 모델이 강해질수록 검증 모델도 함께 강해지는 구조예요. DeepSeek은 이를 “검증 계산을 스케일링해 자동으로 새로운 검증 어려운 증명에 라벨을 달고, 검증 모델을 더욱 개선할 훈련 데이터를 만든다”고 설명합니다.

압도적인 성적표

DeepSeekMath-V2의 성과는 IMO에 그치지 않습니다. 중국 최고 난이도 수학 경시대회인 중국수학올림피아드(CMO) 2024에서도 최상위 성적을 냈고, 미국 대학생 수학 경시대회인 Putnam 2024에서는 12문제 중 11문제를 완벽히 해결하고 나머지 1문제도 사소한 오류만으로 118/120점을 기록했습니다. 역대 최고 인간 점수가 90점이었다는 걸 생각하면 놀라운 성과죠.

참고로 IMO는 전 세계에서 가장 어려운 고등학생 수학 경시대회로 꼽힙니다. 2025년 대회에는 630명의 학생이 참가했고, 그중 72명만이 금메달을 받았어요.

AI 민주화의 새로운 장

DeepSeek의 행보는 AI 업계에 중요한 질문을 던집니다. 오픈소스 모델이 폐쇄형 상업 제품의 경쟁력을 잠식할 수 있을까요? DeepSeek은 이미 저렴한 비용의 오픈소스 모델 DeepSeek-R1으로 미국 AI 시스템에 필적하는 성능을 보여주며 주목받았고, 이는 한때 NVIDIA 같은 AI 대기업들의 투자자 신뢰를 흔들기도 했습니다.

들랑그는 “AI와 지식의 민주화가 최고의 형태로 실현됐다”고 말했습니다. 누구나 Hugging Face에서 모델 가중치를 다운로드해 사용할 수 있으니까요. 물론 이 모델이 모든 수학 문제를 완벽히 풀지는 못합니다. 하지만 자체 검증을 통해 추론의 엄밀성을 확보하려는 시도는, 정답이 정해지지 않은 열린 문제들을 다루는 데 특히 중요한 발전입니다. DeepSeek 연구팀의 표현대로 “아직 해야 할 일이 많지만, 이 결과들은 자체 검증 가능한 수학적 추론이 실현 가능한 연구 방향임을 시사합니다.”

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다