LLM
AI가 즐겨 쓰는 문장 패턴, 기업 문서에서 4년 만에 4배 증가
“It’s not just X, it’s Y” 문장 구조가 기업 공식 문서에서 2023~2025년 사이 4배 넘게 급증. AI가 선호하는 언어 패턴이 새로운 글쓰기 지문이 되고 있습니다.
Written by

Qwen3.6-Max, 코딩 벤치마크 1위지만 오픈소스는 없다, Alibaba의 전략 전환
Alibaba가 Qwen 최초의 클로즈드 웨이트 모델 Qwen3.6-Max-Preview를 출시했습니다. 코딩 벤치마크 6개 1위, 오픈소스 포기의 의미를 분석합니다.
Written by

AI 에이전트 개발의 함정, LLM에 계산 맡기면 반드시 실패한다
Google AI Agent Bake-Off 실전 해커톤에서 나온 교훈. LLM 역할 분리, 모듈식 설계, 결정론적 실행으로 프로덕션급 에이전트를 만드는 법을 소개합니다.
Written by

새 웹사이트 35%가 AI 생성, 그런데 우리가 틀린 것들
신규 웹사이트 35%가 AI 생성이라는 연구 결과. 그런데 허위정보 증가·문체 획일화 등 대중이 믿는 공포 대부분은 데이터로 확인되지 않았습니다.
Written by

AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다
AI 에이전트 스킬이 벤치마크와 달리 현실 조건에서 성능 이점이 거의 사라진다는 연구 결과. 34,000개 실제 스킬로 테스트한 UC Santa Barbara·MIT 연구팀의 분석.
Written by

Anthropic이 정리한 멀티 에이전트 5가지 패턴, 선택 기준과 한계
Anthropic이 정리한 멀티 에이전트 5가지 조율 패턴. 언제 어떤 패턴을 써야 하는지 판단 기준과 각 패턴의 한계를 소개합니다.
Written by

존재하지 않는 병을 AI에게 물었더니, ChatGPT·Gemini의 답변
존재하지 않는 안구 질환 bixonimania를 만들었더니 ChatGPT·Gemini 등 주요 AI가 실제 질환으로 설명했습니다. AI의 지식이 어떻게 형성되는지를 드러낸 실험입니다.
Written by

AI가 ‘무난함’을 대량생산하는 시대, 진짜 경쟁력은 거부 능력이다
AI가 ‘무난한 결과물’을 대량 생산하는 시대, 진짜 경쟁력은 생성 능력이 아니라 무엇이 잘못됐는지 정확히 거부하는 능력이라는 인사이트를 소개합니다.
Written by

AI 에이전트가 제로데이를 찾는다, 보안 취약점 연구의 판이 바뀌는 이유
AI 에이전트가 취약점을 찾는 시대가 왔다. 보안 전문가 Thomas Ptacek의 분석으로 보는 LLM이 익스플로잇 연구에 유독 강한 이유와 그 파급력.
Written by

Claude Code가 자기 말을 내 말로 둔갑시킨다, 반복 목격된 메시지 귀속 버그
Claude Code가 자신의 내부 추론 메시지를 사용자 발화로 잘못 귀속시키는 버그 사례. 서버 삭제 등 실제 피해가 발생했고 HN 1위까지 오른 이슈입니다.
Written by
