프롬프트엔지니어링
프롬프트도 기술 부채다, 정교하게 설정할수록 더 위험한 이유
정교한 프롬프트 설정이 오히려 독이 될 수 있다는 GitHub 엔지니어의 주장. 모델이 바뀔 때마다 조용히 무력화되는 프롬프트 부채의 위험성을 다룹니다.
Written by

오픈소스 AI, 비용은 30분의 1로 프론티어 성능에 도달하다
오픈소스 모델 MiniMax M2.5로 147명이 도전한 실험에서 클로즈드소스 대비 30분의 1 비용으로 유사한 성능을 달성했습니다. 하네스 선택과 프롬프팅 전략이 결과를 바꾼 이유를 소개합니다.
Written by

AI 에이전트 시대, 소프트웨어 엔지니어링의 영역이 코드 밖으로 확장된다
AI 에이전트가 코드를 자동화할수록 엔지니어링의 범위는 프롬프트·워크플로우·거버넌스까지 확장된다는 Chalmers 대학 연구팀의 논문을 소개합니다.
Written by

GPT-5.5 제대로 쓰려면 프롬프트 처음부터 다시 짜야 한다
OpenAI가 GPT-5.5 출시와 함께 공개한 공식 프롬프팅 가이드 핵심 정리. 기존 프롬프트를 그대로 이식하면 역효과가 나는 이유와 outcome-first 프롬프팅의 원칙을 소개합니다.
Written by

LLM에 감정을 넣으면 성능이 오를까, 6가지 감정 실험 결과
LLM에 감정 표현을 넣으면 성능이 오른다는 통념을 Harvard 연구팀이 실험으로 검증. 고정 감정은 효과 미미하지만, 적응형 감정 선택(EmotionRL)은 유효하다는 결과를 소개합니다.
Written by

Claude Code로 혼자 60만 줄 썼다, gstack이 뭐길래
YC CEO 개리 탄의 Claude Code 세팅 ‘gstack’ 공개 후 GitHub 스타 2만 개와 논란이 동시에 터진 이유. AI 에이전트 코딩 노하우의 표준화 문제를 짚습니다.
Written by

AI 응답에서 프롬프트를 역추적한다, 리버스 프롬프팅 실험
AI 응답에서 원래 프롬프트를 역추적하는 리버스 프롬프팅 실험. DEJAN이 Gemma 3 270M을 파인튜닝해 만든 도구의 작동 원리와 활용 가능성을 소개합니다.
Written by

AI 에이전트로 검색 품질 6-10% 올린 실험, ML 팀 없이도 가능하다
ML 팀 없이 AI 에이전트 하나로 검색 품질을 6-10% 개선한 실험. 에이전틱 검색의 작동 방식, 실패 패턴, 지연 시간 트레이드오프를 소개합니다.
Written by

Claude가 XML 태그에 유독 잘 반응하는 이유, 언어학으로 풀었다
Claude에서 XML 태그가 효과적인 이유를 언어학적 원리로 설명한 글. 1차/2차 표현 구분이라는 모든 언어에 공통된 구조와 연결해 해석합니다.
Written by

멀티턴 대화에서 LLM 정확도 33% 하락, GPT-5도 예외 없었다
GPT-5 포함 최신 LLM도 대화가 길어지면 정확도가 33% 하락한다는 연구. 원인과 패턴을 분석합니다.
Written by
