코딩AI
SWE-bench Verified 폐기, AI 코딩 벤치마크의 신뢰성 위기
OpenAI가 AI 코딩 능력 측정 표준 벤치마크 SWE-bench Verified를 폐기했습니다. 테스트 결함과 훈련 데이터 오염, 두 가지 치명적 문제를 발견했기 때문입니다.
Written by

GLM-5 등장, 744B 파라미터 오픈소스 모델이 에이전트 벤치마크 1위
Z.ai가 744B 파라미터 오픈소스 모델 GLM-5를 공개했습니다. DeepSeek 기술을 통합해 에이전트 작업에 특화된 성능을 보여줍니다.
Written by

코딩 AI는 왜 빠르게 성장했을까, AI 에이전트의 유일한 해자는 데이터
AI 에이전트 시장을 4개 사분면으로 분석하고, 왜 데이터 수집 구조가 유일한 경쟁 우위인지 설명합니다. 코딩 AI가 빠르게 성장한 이유와 각 영역별 데이터 전략을 소개합니다.
Written by

여행사는 10년 걸렸지만, 개발자는 3년째: AI가 바꾸는 개발자 시장
여행사 산업이 10년 걸려 붕괴했다면, AI 시대 개발자는 3년째입니다. LLM 채택률 84%, 빠르게 변하는 개발자 시장에서 살아남는 전략을 소개합니다.
Written by

구글 Gemini 3 Flash 출시: Pro급 성능을 3배 빠른 속도로, 무료 제공
구글이 Pro급 성능을 3배 빠른 속도로 제공하는 Gemini 3 Flash를 출시했습니다. 코딩 벤치마크 78% 달성, 무료 전방위 배포로 AI 대중화를 가속합니다.
Written by

GPT-5.2 출시: 전문가 능가하는 첫 AI, 11배 빠르고 비용은 1%
OpenAI GPT-5.2 출시. 44개 직업에서 전문가 수준 능가, 11배 빠르고 비용 1%. 환각 30% 감소, 긴 문맥·비전 능력 획기적 개선.
Written by

Gemini 3가 보여준 AI의 3년: 시 쓰는 기계에서 논문 쓰는 동료로
Google Gemini 3 발표로 본 AI의 3년 진화. 시를 쓰던 AI가 논문을 작성하고 게임을 만드는 ‘디지털 동료’로 성장한 과정을 실사용 사례로 분석합니다.
Written by

GPT-5.1 출시: 속도와 깊이를 동시에 잡은 OpenAI의 반격
OpenAI가 GPT-5.1을 출시하며 적응형 추론 기능을 도입했습니다. 간단한 질문엔 빠르게, 복잡한 문제엔 깊게 생각하는 GPT-5.1의 성능과 전략적 의미를 살펴봅니다.
Written by

구글의 AI 업무 활용법: 14가지 실전 사례로 보는 업무 효율성 혁명
구글이 공개한 14가지 실제 AI 활용 사례를 통해 코드 생성 30% 자동화, 엔지니어링 속도 10% 향상 등의 성과와 우리가 바로 적용할 수 있는 실무 AI 활용법을 소개합니다.
Written by

GPT-5 출시 파장: 혁신과 반발 사이에서 찾는 새로운 길
OpenAI GPT-5 출시로 촉발된 AI 업계 변화와 사용자 반발, 가격 경쟁 가능성을 분석하고 향후 AI 생태계 전망을 제시하는 글
Written by
