LLM
AI 응답에서 프롬프트를 역추적한다, 리버스 프롬프팅 실험
AI 응답에서 원래 프롬프트를 역추적하는 리버스 프롬프팅 실험. DEJAN이 Gemma 3 270M을 파인튜닝해 만든 도구의 작동 원리와 활용 가능성을 소개합니다.
Written by

Karpathy가 선언한 코딩의 종말, 에이전틱 엔지니어링 시대가 왔다
Andrej Karpathy가 선언한 에이전틱 엔지니어링 시대. 바이브 코딩을 넘어 에이전트가 밤새 스스로 실험하는 AutoResearch까지, 코딩의 미래를 정리합니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI가 수학자의 미발표 증명을 풀었다, First Proof 1라운드 결과와 남겨진 문제들
AI가 수학자의 미발표 보조 정리 10개 중 8개를 증명한 First Proof 벤치마크 결과. 성능 격차와 검증 문제까지 정리합니다.
Written by

AI가 사람처럼 보이려면 멍청한 척해야 한다, GPT-4.5 튜링 테스트 결과
GPT-4.5가 오타와 소문자, 틀린 계산으로 멍청한 척했을 때 참가자 73%를 속인 튜링 테스트 연구. AI가 인간처럼 보이려면 능력을 숨겨야 한다는 역설을 다룹니다.
Written by

MiniMax M2.7, 자기 진화 100회 반복으로 성능 30% 높인 방법
MiniMax M2.7이 100회 이상의 자율 최적화 루프로 자신의 강화학습 파이프라인을 개선해 성능 30%를 높인 방법. GLM-5 동급 성능을 1/3 비용으로 달성한 과정도 소개합니다.
Written by

AI 에이전트 규칙, 많을수록 멍청해진다? 컨텍스트 엔지니어링의 함정과 해법
AI 에이전트에 규칙을 쌓을수록 성능이 떨어지는 이유와 해법. 3단 피라미드 구조, 우선순위 조항, 긍정형 제약 등 컨텍스트 엔지니어링 핵심을 정리합니다.
Written by

AI가 쓴 글인데, 이제 구분이 안 된다, Ahrefs 에디터의 고백
Ahrefs 에디터가 자신의 콘텐츠 제작 워크플로를 AI로 대체한 경험을 공개. AI 글쓰기 품질이 인간과 구분 불가능한 수준에 도달했다고 주장합니다.
Written by

AI 에이전트에게 기억을 더 줄수록 오히려 멍청해진다, PlugMem이 찾은 해법
AI 에이전트에 메모리를 더 줄수록 성능이 떨어지는 역설을 해결한 Microsoft Research의 PlugMem 연구. 인지과학 기반 지식 중심 메모리 구조를 소개합니다.
Written by

Mistral Small 4, 추론·멀티모달·코딩을 하나로 합친 119B 오픈소스 모델
Mistral AI가 추론·멀티모달·코딩 에이전트 기능을 통합한 119B 오픈소스 모델 Mistral Small 4를 공개했습니다. MoE 아키텍처로 효율을 유지하면서 다목적 활용이 가능한 모델입니다.
Written by
