Qwen이 Opus급이라는 말의 진실, 직접 굴려본 창업자의 현실 보고서
1만 5천 달러 GPU로 로컬 Qwen을 1년 넘게 운영한 창업자의 실전 후기. 벤치마크 점수와 실제 신뢰도의 차이, 그리고 로컬 모델이 진짜 빛나는 용도를 짚습니다.
Written by
무료 ChatGPT가 의사 답변보다 높은 점수를 받았다, GPT-5.5 Instant 건강 업그레이드
무료 ChatGPT의 GPT-5.5 Instant가 의사 작성 답변보다 높은 점수를 받았다는 OpenAI 발표. 성능 개선의 실체와 자체 평가라는 한계를 함께 짚습니다.
Written by
AI 에이전트는 왜 아직 사람이 필요한가, goose 팀의 자기개선 루프
“AI가 스스로 발전한다”는 유행 속에서 오픈소스 에이전트 goose 팀이 자기개선 루프에 여전히 사람을 끼워 넣는 이유. 벤치마크를 버그 리포트로 보는 관점을 소개합니다.
Written by
Claude가 신분증을 요구하기 시작했다, AI 챗봇에 들어온 신원 인증의 의미
Anthropic이 7월 8일부터 Claude 소비자 사용자에게 정부 신분증과 얼굴 인증을 요구합니다. 생체정보 수집과 수출통제 배경, 개인 사용자에게 갖는 의미를 짚습니다.
Written by
OpenAI Codex, 프롬프트 대신 시연으로 AI를 가르치는 Record & Replay
OpenAI가 macOS용 Codex에 Record & Replay를 추가했습니다. 작업을 한 번 시연하면 재사용 가능한 스킬로 만들어 반복하는 기능으로, 프롬프트 대신 시연으로 AI를 가르치는 방식을 소개합니다.
Written by
같은 작업에 토큰을 더 쓰는 AI, Copilot이 매 턴 반복 비용을 줄인 방법
GitHub Copilot이 프롬프트 캐싱과 도구 검색, Auto 모델 라우팅으로 매 턴 반복되는 토큰 비용을 줄인 방법. 사용량 기반 과금 시대에 효율의 정의가 어떻게 바뀌는지 짚어봅니다.
Written by
엔지니어 99%가 매일 AI를 쓰는 회사에서 벌어진 일, 스포티파이가 본 진짜 병목
엔지니어 99%가 AI 코딩 도구를 쓰는 스포티파이에서 병목이 코딩에서 의사결정으로 옮겨간 이야기. 백그라운드 에이전트 Honk와 ‘에이전트를 위한 개발자 경험’을 소개합니다.
Written by
AI가 코드를 짤수록 더 자주 터진다, Kiro의 13시간 장애가 남긴 교훈
AWS Kiro가 프로덕션을 삭제해 13시간 장애를 일으킨 사건과, AI 코딩 시대에 검증·격리 규율이 왜 더 중요해지는지 Charity Majors와 Fly·Docker의 관점으로 풀어봅니다.
Written by
고양이 그림 만들던 Midjourney가 전신 초음파 스캐너를 공개했다
AI 이미지 생성으로 유명한 Midjourney가 전신 초음파 스캐너와 스파를 공개했습니다. 60초 MRI라는 비전과 12명·20분이라는 현재 사이의 간극을 짚어봅니다.
Written by
CLAUDE.md에 “항상 이렇게 해”라고 적으면 안 되는 이유, Claude Code 제어 7가지 방법
Claude Code 동작을 제어하는 7가지 방법을 정리한 Anthropic 가이드. CLAUDE.md 지시문과 결정론적 가드레일의 결정적 차이를 짚습니다.
Written by









