Archive
ChatGPT 수학·과학 인터랙티브 시각화, 변수 조작하며 실시간으로 보는 공식
OpenAI가 ChatGPT에 수학·과학 인터랙티브 시각화 기능을 추가했습니다. 70개 이상의 개념에서 변수를 직접 조작하며 실시간으로 공식 변화를 확인할 수 있습니다.
Written by

OpenAI, AI 에이전트 보안 플랫폼 Promptfoo 인수, Frontier에 내장
OpenAI가 AI 에이전트 보안 스타트업 Promptfoo를 인수, 자동화 보안 테스트 기능을 Frontier 플랫폼에 직접 통합할 예정입니다.
Written by

Claude Code 언어별 비용 실험, 동적 타입이 정적 타입보다 최대 2.6배 저렴했다
Claude Code로 13개 언어의 코딩 비용과 속도를 실험한 결과. Ruby·Python·JS가 정적 타입 언어보다 최대 2.6배 빠르고 저렴했습니다. AI 코딩 에이전트와 언어 선택의 관계를 데이터로 분석합니다.
Written by

Claude Code 에이전트 5개가 동시에 코드를 짰다, Hatice 프로젝트 분석
Claude Code 에이전트 5개가 병렬로 이슈를 처리하는 오픈소스 시스템 Hatice. 이슈 트래커에서 코드 커밋까지 자동화하는 에이전트 오케스트레이션 구조를 소개합니다.
Written by

AI가 만들어낸 새 질병들, AI 불안부터 인지 무기력까지
AI 확산과 함께 등장한 AI FOMO, AI 의존 증후군, 인지 무기력 등 15가지 심리적 반응을 정리한 Computerworld 칼럼을 소개합니다. 기술 변화 속도와 인간 적응 속도의 불일치가 만들어낸 현상들입니다.
Written by

Qwen2-72B 중간 레이어 7개 복제로 리더보드 1위, 가중치는 단 하나도 안 건드리고
가중치 수정 없이 레이어 복제만으로 LLM 리더보드 1위를 달성한 실험. 트랜스포머 내부의 기능적 ‘회로’ 구조를 발견한 LLM Neuroanatomy 이론을 소개합니다.
Written by

AI가 만든 코드를 AI가 검토한다, Anthropic Code Review 공개
Anthropic이 PR마다 다중 에이전트를 투입해 로직 버그를 탐지하는 Code Review를 공개했습니다. 내부 테스트에서 실질 리뷰 비율 16%→54% 개선, Team·Enterprise 프리뷰 제공.
Written by

GitHub 이슈 제목 하나로 개발자 4,000대가 뚫렸다, Clinejection 공격 해부
GitHub 이슈 제목 하나로 시작된 프롬프트 인젝션이 5단계 연쇄 공격으로 이어져 개발자 4,000대에 무단 AI 설치. Clinejection 공격의 구조와 의미를 분석합니다.
Written by

AI 에이전트 성능을 가르는 두 가지 설계 원칙, 이너 루프와 AGENTS.md
AI 에이전트 성능을 결정하는 이너 루프(자기 검증)와 아우터 루프(세션 간 학습), AGENTS.md 작성 원칙을 ETH 취리히 연구 데이터와 함께 소개합니다.
Written by

