Archive
AI 성격은 주입하는 게 아니었다, LLM 내부 페르소나 서브네트워크 발견
LLM 파라미터 안에 성격 유형별 서브네트워크가 이미 존재한다는 연구. 훈련 없이 마스킹만으로 페르소나를 격리·전환하는 방법을 소개합니다.
Written by

SaaS 주가 30% 폭락, AI가 소프트웨어를 삼키는 건가
AI 코딩 에이전트의 등장으로 SaaS 과금 모델이 흔들리는 ‘SaaSpocalypse’ 현상과 이에 반론을 제기한 a16z의 낙관론을 함께 정리했습니다.
Written by

Perplexity pplx-embed, 구글·알리바바 수준 성능에 메모리 32배 절약
Perplexity가 공개한 오픈소스 임베딩 모델 pplx-embed. 구글·알리바바 수준 성능을 유지하면서 메모리는 최대 32배 절약하는 양자화 기술을 적용했습니다.
Written by

AI 에이전트 코딩 회의론자가 마음을 바꾼 이유, AGENTS.md와 Opus 4.5 실전 후기
AI 에이전트 코딩 회의론자였던 데이터 사이언티스트 Max Woolf가 Claude Opus 4.5로 Rust ML 라이브러리를 구현하며 생각을 바꾼 실전 후기. AGENTS.md 파일이 결과 품질을 결정한다는 통찰을 소개합니다.
Written by

ChatGPT가 잔소리를 줄였다, GPT-5.3 Instant 업데이트의 핵심
OpenAI가 ChatGPT 기본 모델을 GPT-5.3 Instant로 업데이트. 환각률 최대 26.8% 감소, 불필요한 경고 문구 축소. 유용성과 안전성 균형 재조정의 의미를 소개합니다.
Written by

마리오로 이해하는 에이전틱 AI, 슈퍼버섯부터 강화학습까지
마리오 게임 비유로 에이전틱 AI의 기반 모델, 모델 하네스, 도구, 강화학습을 쉽게 설명합니다. ML 엔지니어 Han Lee의 원문 큐레이션.
Written by

멀티턴 대화에서 LLM 정확도 33% 하락, GPT-5도 예외 없었다
GPT-5 포함 최신 LLM도 대화가 길어지면 정확도가 33% 하락한다는 연구. 원인과 패턴을 분석합니다.
Written by

AI한테 “이거 사지 마”라고 물으면 어떤 일이 생길까
AI에게 “사지 말아야 할 것”을 물었을 때 Google AI Mode·Copilot·ChatGPT가 얼마나 다르게 반응하는지 실험한 iPullRank의 분석. AI 검색에서 출처와 브랜드 평판의 관계를 다룹니다.
Written by

LLM마다 추천 브랜드가 다르다, GEO 시대 브랜드 노출 전략
ChatGPT·Gemini·Claude마다 추천 브랜드가 다른 이유와 LLM 안에서 브랜드-카테고리 연결을 쌓는 전략, 블랙햇 GEO 리스크까지 정리했습니다.
Written by

AI 에이전트, 프로덕션에 올리기 전에 반드시 알아야 할 것들
에이전트는 기존 소프트웨어와 다르게 모니터링해야 합니다. LangChain이 정리한 자연어 입력의 무한성과 LLM 비결정성 문제, 그리고 어노테이션 큐·LLM 평가자를 활용한 프로덕션 옵저버빌리티 전략을 소개합니다.
Written by
