ChatGPT 방문자 44%, 실제론 아무것도 묻지 않는다, AI 검색 점유율의 착각
ChatGPT 방문자 44%는 실제로 아무것도 입력하지 않는다는 SparkToro·Datos 공동 연구. AI 검색 점유율이 얼마나 과장돼 있는지 데이터로 분석합니다.
Written by

Claude Opus 4.6, 시험 문제를 스스로 해킹하다, AI 벤치마크 신뢰성의 균열
Claude Opus 4.6가 벤치마크 테스트 중 스스로 평가 상황을 인식하고 암호화된 정답 키를 직접 해독한 전례 없는 사례. AI 벤치마크 신뢰성에 새로운 질문을 던집니다.
Written by

임원 62%, 주요 결정을 AI에 맡긴다, AI 의존이 부르는 인지 저하 우려
영국 임원 200명 설문에서 62%가 AI로 주요 결정을 내리고, 70%는 AI와 의견이 다를 때 자신을 의심한다는 결과. AI 의존이 비판적 사고를 약화시킨다는 연구들과 함께 살펴봅니다.
Written by

AI 일자리 대체론, 거시경제 데이터는 왜 동의하지 않는가
Citadel Securities 매크로 분석으로 보는 AI 일자리 대체론의 실체. 채용 공고·GDP·신사업 등록 데이터는 왜 대체 내러티브와 다른 방향을 가리키는가.
Written by

AI 에이전트용 CLI는 사람용과 설계부터 다르다, Google 엔지니어의 실전 경험
AI 에이전트가 CLI를 사용할 때 생기는 새로운 실수 패턴과, Google 엔지니어가 에이전트 우선으로 설계한 CLI의 핵심 원칙을 소개합니다.
Written by

Agent Skills, 이제 직접 테스트하고 검증한다, Anthropic skill-creator 업데이트
Anthropic이 skill-creator에 eval 작성·벤치마크·트리거 최적화 기능을 추가했습니다. 코드 없이 Agent Skills 품질을 검증하고 개선할 수 있습니다.
Written by

ChatGPT 수학·과학 인터랙티브 시각화, 변수 조작하며 실시간으로 보는 공식
OpenAI가 ChatGPT에 수학·과학 인터랙티브 시각화 기능을 추가했습니다. 70개 이상의 개념에서 변수를 직접 조작하며 실시간으로 공식 변화를 확인할 수 있습니다.
Written by

OpenAI, AI 에이전트 보안 플랫폼 Promptfoo 인수, Frontier에 내장
OpenAI가 AI 에이전트 보안 스타트업 Promptfoo를 인수, 자동화 보안 테스트 기능을 Frontier 플랫폼에 직접 통합할 예정입니다.
Written by

Claude Code 언어별 비용 실험, 동적 타입이 정적 타입보다 최대 2.6배 저렴했다
Claude Code로 13개 언어의 코딩 비용과 속도를 실험한 결과. Ruby·Python·JS가 정적 타입 언어보다 최대 2.6배 빠르고 저렴했습니다. AI 코딩 에이전트와 언어 선택의 관계를 데이터로 분석합니다.
Written by

Claude Code 에이전트 5개가 동시에 코드를 짰다, Hatice 프로젝트 분석
Claude Code 에이전트 5개가 병렬로 이슈를 처리하는 오픈소스 시스템 Hatice. 이슈 트래커에서 코드 커밋까지 자동화하는 에이전트 오케스트레이션 구조를 소개합니다.
Written by
