LLM
프롬프트 두 번 붙여넣기로 LLM 정확도 높이는 방법, Google 연구 결과
Google Research가 발견한 프롬프트 반복 기법. LLM에 같은 프롬프트를 두 번 입력하면 비용·지연 증가 없이 정확도가 오릅니다.
Written by

Qwen3.5, 397B MoE 아키텍처로 네이티브 멀티모달 에이전트 시대 열다
Alibaba가 공개한 Qwen3.5는 397B 파라미터 MoE 모델로, 추론 시 17B만 활성화해 비용을 낮추고 네이티브 멀티모달과 에이전트 특화 훈련을 결합했습니다.
Written by

AI 테스트 전부 통과, 버그는 그대로였다, Ground Truth 문제
AI가 작성한 테스트가 모두 통과해도 버그가 남아있는 이유. Ground Truth 문제와 AST 비교 방식으로 해결한 Doodledapp 팀의 실전 경험을 소개합니다.
Written by

AI가 글을 다듬을수록 사라지는 것들, ‘시멘틱 어블레이션’
AI가 글을 다듬을수록 독창성과 정보 밀도가 사라지는 현상, ‘시멘틱 어블레이션’ 개념과 그 작동 원리를 소개합니다.
Written by

Claude Sonnet 4.6, Opus급 성능을 Sonnet 가격에 — 코딩·컴퓨터 사용 대폭 개선
Anthropic이 Claude Sonnet 4.6을 출시했습니다. Opus급 성능을 Sonnet 가격에 제공하며, 코딩·컴퓨터 사용·장기 추론 전반에서 대폭 개선됐습니다.
Written by

AI 에이전트가 1,000개 도구 중 정확히 고르는 법, MIT BEACON 탐색 알고리즘
MIT가 개발한 BEACON 알고리즘으로 AI 에이전트가 1,000개 도구 중에서도 정확하게 선택할 수 있게 되었습니다. 속도 3배 향상의 비결을 소개합니다.
Written by

AI 에이전트 코딩 이후, 개발 도구는 어떻게 진화하는가
에이전트 코딩의 미래를 둘러싼 세 가지 상반된 관점. 새로운 프로그래밍 언어, 조용한 AI 도구, 에이전트가 곧 언어라는 주장을 비교 분석합니다.
Written by

Pi 코딩 에이전트, 4개 도구와 1,000토큰으로 벤치마크 상위권 달성
4개 도구와 1,000토큰 미만의 프롬프트로 만든 Pi 코딩 에이전트가 벤치마크 상위권에 오른 비결. 최소주의 설계 철학과 실제 성과를 소개합니다.
Written by

틀릴수록 더 자신만만해진다, Apple 연구진이 밝힌 LLM의 역설
Apple 연구진이 LLM의 역설적 특성을 발견했습니다. 틀릴 가능성이 높을수록 더 자신감 있게 답하는 AI의 구조적 한계를 소개합니다.
Written by

Gemini 3 Flash, 이미지를 확대하고 조작하며 탐색하는 Agentic Vision 공개
Gemini 3 Flash의 Agentic Vision 기능 소개. AI가 이미지를 확대하고 조작하며 능동적으로 탐색해 정확도를 5-10% 높입니다.
Written by
