SWE-Bench
MiniMax M2.5, 시간당 1달러로 실행하는 코딩 에이전트
MiniMax M2.5는 시간당 1달러로 실행 가능한 코딩 에이전트입니다. SWE-Bench 80.2% 달성하며 실무 도입의 경제적 장벽을 낮춥니다.
Written by

Qwen3-Coder-Next 출시, 3B 활성 파라미터로 코딩 에이전트 시장 진입
Alibaba Qwen 팀이 코딩 에이전트 특화 모델 Qwen3-Coder-Next를 출시했습니다. 80B 파라미터 중 3B만 활성화하는 희소 MoE 구조로 비용 효율성과 성능을 동시에 달성했습니다.
Written by

Claude Code 개발팀이 밝히는 AI 에이전트 평가의 모든 것
AI 에이전트 개발 시 평가 시스템을 어떻게 구축할까? Anthropic이 Claude Code 개발 경험을 바탕으로 공개한 실전 가이드. 에이전트 유형별 평가 전략과 20-50개 태스크로 시작하는 로드맵을 소개합니다.
Written by

MiniMax M2.1: Python 넘어 Rust·Java까지, 실무 다중언어 코딩 특화 AI 모델
MiniMax M2.1은 Python을 넘어 Rust, Java, Golang 등 실무 다중 언어에 특화된 오픈소스 AI 모델. Claude Sonnet 4.5 능가하는 성능과 실무 활용성을 소개합니다.
Written by

Claude Opus 4.5, AI 코딩 벤치마크 1위 달성하고 가격은 80% 내렸다
Anthropic의 Claude Opus 4.5가 AI 코딩 벤치마크 1위를 달성하면서도 API 가격을 80% 인하했습니다. Chrome과 Excel 직접 제어 기능까지 추가된 업계 판도 변화를 소개합니다.
Written by

MiniMax M2가 보여준 효율성 혁명: Claude의 8% 비용, 2배 빠른 속도
중국 MiniMax가 공개한 M2 모델이 Claude Sonnet 비용의 8%, 2배 빠른 속도로 Claude Opus 4.1을 앞서는 성능을 달성했습니다. 230억 파라미터 중 100억만 활성화하는 효율적 설계와 실전 활용법을 소개합니다.
Written by

Claude Haiku 4.5 출시: Sonnet 4 성능을 1/3 가격에
Anthropic의 Claude Haiku 4.5는 5개월 전 최첨단 성능을 1/3 가격에 2배 빠른 속도로 제공하며 AI 활용의 패러다임을 바꾸고 있습니다. 실전 코딩부터 멀티 에이전트 협업까지 새로운 가능성을 확인하세요.
Written by

Claude Sonnet 4.5, AI 코딩 모델의 새로운 챔피언
Anthropic의 Claude Sonnet 4.5가 SWE-bench에서 70.6%를 기록하며 GPT-5를 제치고 1위에 올랐다. 30시간 이상 자율 코딩이 가능하며 다양한 산업에서 실질적 성과를 보이고 있다.
Written by

개발자를 위한 새로운 AI 동반자: Mistral의 Devstral이 바꾸는 소프트웨어 개발 환경
Mistral AI의 새로운 소프트웨어 개발 특화 AI 모델 Devstral이 가져올 개발 환경의 변화와 실제 활용 방안을 분석한 글입니다. 기존 AI 코딩 도구의 한계를 극복하고 실제 GitHub 이슈 해결에 특화된 이 모델의 성능과 의미를 살펴봅니다.
Written by
