AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

코딩AI

2026-07-11
Grok 4.5, 코딩 성능보다 토큰 효율로 승부한다
AI 트렌드 분석
xAI가 Cursor와 공동 훈련한 Grok 4.5의 벤치마크 실제 위치와 토큰 효율·가격 경쟁력을 정리합니다.
Written by
Spark
2026-07-11
인간 극복상 없이 끝난 AtCoder, AI의 완승
AI 인사이트
OpenAI AI가 AtCoder World Tour Finals에서 세계 최정상급 프로그래머 전원을 꺾은 결과와 작년 대비 달라진 격차를 정리합니다.
Written by
Spark
2026-06-18
절반 크기로 프런티어를 따라잡은 GLM-5.2, 그 비결은 점수가 아니었다
AI 기술 분석
절반 크기로 클로즈드 프런티어를 추격한 오픈웨이트 모델 GLM-5.2. 1M 컨텍스트를 실사용 가능하게 만든 IndexShare와, 모델이 정답을 훔치려 한 부정행위를 막은 RL 기법을 소개합니다.
Written by
Spark
2026-06-10
AI 조수가 사라지고 AI 스튜디오가 생겼다, Claude Fable 5 등장
AI 트렌드 분석
Anthropic의 Mythos 클래스 첫 일반 공개 모델 Claude Fable 5 출시. 수 시간 자율 실행, 멀티 에이전트 운용 등 AI와 협업하는 방식 자체가 달라지는 변화를 소개합니다.
Written by
Spark
2026-05-06
Kimi K2.6, Claude·GPT·Gemini를 제친 오픈웨이트 모델의 전략
AI 트렌드 분석
중국 스타트업 Moonshot AI의 오픈웨이트 모델 Kimi K2.6이 실시간 코딩 대결에서 Claude·GPT-5.5·Gemini를 제쳤습니다. 모델별 전략 차이와 그 의미를 분석합니다.
Written by
Spark
2026-04-22
Qwen3.6-Max, 코딩 벤치마크 1위지만 오픈소스는 없다, Alibaba의 전략 전환
AI 트렌드 분석
Alibaba가 Qwen 최초의 클로즈드 웨이트 모델 Qwen3.6-Max-Preview를 출시했습니다. 코딩 벤치마크 6개 1위, 오픈소스 포기의 의미를 분석합니다.
Written by
Spark
2026-04-17
Claude Opus 4.7 출시, 에이전트 자율성과 비전 해상도 대폭 향상
AI 트렌드 분석
Anthropic이 Claude Opus 4.7을 출시했습니다. 에이전트 자율성과 비전 해상도가 크게 향상됐으며, 사이버 보안 안전장치도 처음으로 적용됐습니다.
Written by
Spark
2026-04-12
Fortune 500의 29%가 AI를 실제로 쓴다, a16z가 공개한 도입 현황
AI 트렌드 분석
Fortune 500의 29%가 AI 스타트업 실 고객으로 전환됐다는 a16z 내부 데이터 분석. 코딩·지원·검색이 선도하는 이유와 법률·헬스케어의 빠른 움직임을 소개합니다.
Written by
Spark
2026-03-03
SWE-bench Verified 폐기, AI 코딩 벤치마크의 신뢰성 위기
AI 인사이트
OpenAI가 AI 코딩 능력 측정 표준 벤치마크 SWE-bench Verified를 폐기했습니다. 테스트 결함과 훈련 데이터 오염, 두 가지 치명적 문제를 발견했기 때문입니다.
Written by
Spark
2026-02-16
GLM-5 등장, 744B 파라미터 오픈소스 모델이 에이전트 벤치마크 1위
AI 트렌드 분석
Z.ai가 744B 파라미터 오픈소스 모델 GLM-5를 공개했습니다. DeepSeek 기술을 통합해 에이전트 작업에 특화된 성능을 보여줍니다.
Written by
Spark

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)