AI코딩
SWE-bench Verified 폐기, AI 코딩 벤치마크의 신뢰성 위기
OpenAI가 AI 코딩 능력 측정 표준 벤치마크 SWE-bench Verified를 폐기했습니다. 테스트 결함과 훈련 데이터 오염, 두 가지 치명적 문제를 발견했기 때문입니다.
Written by

Claude 에이전트 16개가 C 컴파일러를 만들었다, 그리고 드러낸 것들
Anthropic이 Claude 에이전트 16개로 C 컴파일러를 만든 실험. 무엇을 해냈고, 어디서 한계가 드러났는지 — AI 코딩의 현재 위치를 보여주는 $20,000짜리 사례입니다.
Written by

바이브 코딩 시대, 개발자 CEO가 말하는 35만 달러짜리 작업의 현실
소프트웨어 회사 CEO 출신 개발자 폴 포드가 NYT에 기고한 바이브 코딩 체험기. 35만 달러짜리 프로젝트를 200달러로 혼자 해낸 현실, 그 기쁨과 씁쓸함을 함께 담았습니다.
Written by

Claude Code 9개월 실전 사용자가 발견한 핵심 원칙, 계획 전까지 코드 쓰지 말기
Claude Code 9개월 실전 사용자가 발견한 핵심 원칙. 계획과 실행을 분리하는 주석 사이클 워크플로우와 그 이유를 소개합니다.
Written by

AI가 코드를 10배 빠르게 짜도, 리뷰는 여전히 사람 몫인 이유
AI 코딩 도구가 빨라질수록 리뷰 병목과 방향 설계 문제가 생깁니다. 두 개발자의 실전 경험으로 보는 AI 시대 개발자의 역할.
Written by

AI 테스트 전부 통과, 버그는 그대로였다, Ground Truth 문제
AI가 작성한 테스트가 모두 통과해도 버그가 남아있는 이유. Ground Truth 문제와 AST 비교 방식으로 해결한 Doodledapp 팀의 실전 경험을 소개합니다.
Written by

Claude Code 창시자 “소프트웨어 엔지니어 직함, 2026년부터 사라지기 시작할 것”
Claude Code 창시자 Boris Cherny가 2026년 소프트웨어 엔지니어 직함이 사라지기 시작할 것이라 예측. AI가 코딩을 사실상 해결한 세상에서 개발자의 역할이 어떻게 바뀌는지 소개합니다.
Written by

Claude Sonnet 4.6, Opus급 성능을 Sonnet 가격에 — 코딩·컴퓨터 사용 대폭 개선
Anthropic이 Claude Sonnet 4.6을 출시했습니다. Opus급 성능을 Sonnet 가격에 제공하며, 코딩·컴퓨터 사용·장기 추론 전반에서 대폭 개선됐습니다.
Written by

Spotify 개발자들 12월부터 코드 안 짠다, Claude Code로 Slack에서 배포까지
Spotify 최고 개발자들이 12월부터 코드를 직접 작성하지 않고 Claude Code로 배포까지 완료합니다. 출근 전 Slack에서 끝나는 개발 프로세스를 소개합니다.
Written by

Steve Yegge가 말하는 AI 에이전트 시대, 대기업 절반 인력 감축과 3시간 근무
실리콘밸리 40년 경력 Steve Yegge가 예측하는 AI 에이전트 시대. 대기업 절반 인력 감축, 하루 3시간 근무, 그리고 손으로 코딩하는 시대의 종말.
Written by
