LLM
Claude Sonnet 4.6, Opus급 성능을 Sonnet 가격에 — 코딩·컴퓨터 사용 대폭 개선
Anthropic이 Claude Sonnet 4.6을 출시했습니다. Opus급 성능을 Sonnet 가격에 제공하며, 코딩·컴퓨터 사용·장기 추론 전반에서 대폭 개선됐습니다.
Written by

AI 에이전트가 1,000개 도구 중 정확히 고르는 법, MIT BEACON 탐색 알고리즘
MIT가 개발한 BEACON 알고리즘으로 AI 에이전트가 1,000개 도구 중에서도 정확하게 선택할 수 있게 되었습니다. 속도 3배 향상의 비결을 소개합니다.
Written by

AI 에이전트 코딩 이후, 개발 도구는 어떻게 진화하는가
에이전트 코딩의 미래를 둘러싼 세 가지 상반된 관점. 새로운 프로그래밍 언어, 조용한 AI 도구, 에이전트가 곧 언어라는 주장을 비교 분석합니다.
Written by

Pi 코딩 에이전트, 4개 도구와 1,000토큰으로 벤치마크 상위권 달성
4개 도구와 1,000토큰 미만의 프롬프트로 만든 Pi 코딩 에이전트가 벤치마크 상위권에 오른 비결. 최소주의 설계 철학과 실제 성과를 소개합니다.
Written by

틀릴수록 더 자신만만해진다, Apple 연구진이 밝힌 LLM의 역설
Apple 연구진이 LLM의 역설적 특성을 발견했습니다. 틀릴 가능성이 높을수록 더 자신감 있게 답하는 AI의 구조적 한계를 소개합니다.
Written by

Gemini 3 Flash, 이미지를 확대하고 조작하며 탐색하는 Agentic Vision 공개
Gemini 3 Flash의 Agentic Vision 기능 소개. AI가 이미지를 확대하고 조작하며 능동적으로 탐색해 정확도를 5-10% 높입니다.
Written by

AI 에이전트는 작동 안 한다던 Karpathy, 3개월 만에 입장을 뒤집은 이유
Tesla와 OpenAI의 AI 리더 Karpathy가 3개월 만에 AI 에이전트 회의론자에서 전면 수용자로 바뀐 이유. 80/20에서 20/80으로 뒤집힌 개발 워크플로우의 진실.
Written by

Qwen3-Max-Thinking, GPT-5.2급 추론 능력 갖춘 새 모델 공개
Alibaba Qwen 팀의 최신 추론 모델 Qwen3-Max-Thinking 공개. GPT-5.2급 성능과 자율적 도구 선택 기능으로 복잡한 추론 작업 향상.
Written by

월 $1,500에서 $300으로, LLM API 비용 80% 절감 실전 사례
LLM API 비용을 월 $1,500에서 $300으로 80% 절감한 실전 사례. 실제 프롬프트로 벤치마킹하는 5단계 방법과 자동화 도구를 소개합니다.
Written by

AI 글쓰기 탐지 가이드를 역이용한 Humanizer 도구 등장
Wikipedia의 AI 탐지 가이드를 역이용해 AI 텍스트를 인간답게 만드는 Humanizer 도구 등장. AI 탐지의 한계와 의미를 살펴봅니다.
Written by
