강화학습
-
OpenAI o3 모델의 어두운 이면: 화려한 성능 뒤에 숨겨진 명세 게임과 환각 문제
OpenAI의 최신 추론 모델 o3의 ‘명세 게임(specification gaming)’과 ‘환각(hallucination)’ 문제를 분석하고, 이러한 문제가 AI 발전에 주는 시사점을 알아봅니다. 뛰어난 성능 뒤에 숨겨진 AI의 어두운 측면과 향후 과제를 살펴봅니다.
Written by
-
Forest-of-Thought: AI 추론의 새로운 패러다임과 미래
AI 추론 능력의 진화를 살펴보는 글입니다. Chain-of-Thought에서 시작해 Tree-of-Thought를 거쳐 Forest-of-Thought에 이르는 추론 모델의 발전 과정과 DeepSeek-R1과 같은 최신 추론 모델을 소개합니다. 이러한 기술이 AI의 문제 해결 능력을 어떻게 변화시키고 있는지, 그리고 앞으로의 전망은 어떤지 알아봅니다.
Written by
-
DeepCoder-14B: 오픈소스 AI가 독점 코드 생성 모델과 나란히 서다
오픈소스 AI 코딩 모델 DeepCoder-14B가 OpenAI의 o3-mini 및 o1과 같은 독점 모델과 동등한 성능을 선보이며 AI 코드 생성의 민주화를 이끌고 있습니다. 14B 파라미터로 60.6%의 LiveCodeBench 정확도를 달성한 이 모델의 혁신적인 기술과 사용 방법을 알아봅니다.
Written by
-
텐센트의 혁신, ‘훈위안-T1’—세계 최초 맘바 기반 초대형 AI 모델로 추론 효율성을 재정의하다
텐센트가 출시한 세계 최초의 맘바 기반 초대형 AI 모델 ‘훈위안-T1’이 GPT-4.5를 뛰어넘는 성능을 보여주고 있습니다. 강화학습과 하이브리드 아키텍처를 활용한 이 혁신적 모델의 특징과 미래 전망을 소개합니다.
Written by