추론모델
Microsoft MAI-Thinking-1, 증류 없이 만든 35B 추론 모델이 던지는 질문
Microsoft가 Build 2026에서 공개한 첫 자체 추론 모델 MAI-Thinking-1. 타사 증류 없이 35B 활성 파라미터로 대형 모델과 경쟁하는 MoE 구조와 그 의미를 소개합니다.
Written by

ChatGPT Images 2.0, 그리기 전에 먼저 생각한다
OpenAI가 추론 기능을 탑재한 ChatGPT Images 2.0을 공식 출시했습니다. 생성 전 계획·웹검색·다국어 텍스트 렌더링까지, 이미지 생성의 패러다임이 바뀌고 있습니다.
Written by

GPT-4o도 Gemini도 뚫렸다, AI 추론 모델의 자율 공격 실험
추론 특화 AI 모델이 GPT-4o·Gemini·Grok 3의 안전 필터를 자율적으로 우회한 실험 연구. ‘정렬 회귀’ 개념을 중심으로 AI 안전의 새로운 위협 지형을 소개합니다.
Written by

Mistral Small 4, 추론·멀티모달·코딩을 하나로 합친 119B 오픈소스 모델
Mistral AI가 추론·멀티모달·코딩 에이전트 기능을 통합한 119B 오픈소스 모델 Mistral Small 4를 공개했습니다. MoE 아키텍처로 효율을 유지하면서 다목적 활용이 가능한 모델입니다.
Written by

Mercury 2, 확산 방식으로 기존 추론 모델보다 8배 빠른 LLM 등장
Inception Labs의 Mercury 2는 확산(diffusion) 방식으로 구현한 첫 상용 추론 모델. 엔드투엔드 레이턴시 1.7초로 기존 추론 모델 대비 최대 8배 빠른 속도를 제공합니다.
Written by

Qwen3-Max-Thinking, GPT-5.2급 추론 능력 갖춘 새 모델 공개
Alibaba Qwen 팀의 최신 추론 모델 Qwen3-Max-Thinking 공개. GPT-5.2급 성능과 자율적 도구 선택 기능으로 복잡한 추론 작업 향상.
Written by

2025년 LLM 혁명: RLVR로 훈련비용 90% 절감, 추론 모델의 시대가 왔다
2025년 LLM 분야를 장악한 RLVR+GRPO 기술과 훈련 비용 혁명. 벤치마크의 함정부터 LLM을 슈퍼파워로 활용하는 법까지, Sebastian Raschka의 연례 리뷰를 소개합니다.
Written by

OLMo 3: 학습 데이터부터 추론 과정까지 완전히 열린 AI 모델
Allen AI가 학습 데이터부터 추론 과정까지 전체 개발 파이프라인을 공개한 OLMo 3 발표. 완전 오픈 중 최고 성능의 32B 추론 모델과 9.3조 토큰 데이터셋을 소개합니다.
Written by

OpenAI gpt-oss: GPT-2에서 오픈소스 추론 모델까지의 기술 진화 여정
OpenAI의 첫 오픈소스 추론 모델 gpt-oss의 기술적 혁신과 활용 방법을 GPT-2와 비교 분석하여 소개하는 실용 가이드
Written by

구글 Gemini 2.5 Deep Think: 멀티에이전트로 열어가는 AI 추론의 새 시대
구글의 새로운 AI 추론 모델 Gemini 2.5 Deep Think의 혁신적인 멀티에이전트 시스템과 압도적인 성능, 그리고 AI 업계에 미치는 영향을 분석한 글
Written by
