Claude
AI에게 “정말 확실해?”라고 물으면, 58%가 답을 바꾼다
AI에게 “정말 확실해?”라고 물으면 58%가 답을 바꿉니다. 스탠퍼드 연구로 밝혀진 AI 아첨성 문제의 원인과 구조적 한계를 소개합니다.
Written by

a16z AI Top 100, ChatGPT 독주 속 3개 블록으로 갈라진 시장
a16z가 발표한 AI 소비자 제품 Top 100 6번째 에디션 분석. ChatGPT 독주 속 경쟁자 급성장, 3개 지정학적 블록 분화, 에이전트 신흥 카테고리 부상을 정리합니다.
Written by

Perplexity, 1년 만에 무슨 일이 있었나, 트래픽 정체와 경쟁 뒤처짐의 구조적 이유
한때 Google 킬러로 불린 Perplexity의 미국 웹 트래픽이 1년간 정체된 반면 Claude는 4배 성장. 차별점의 소멸과 법적 압박으로 읽는 구조적 위기.
Written by

ChatGPT가 Excel에 들어왔다, AI 재무모델링 도구 4종 실전 비교
OpenAI가 GPT-5.4 기반 ChatGPT for Excel을 출시했습니다. Wall Street Prep의 독립 벤치마크로 본 AI 재무모델링 도구 4종의 실전 성능을 소개합니다.
Written by

Claude로 랜딩 페이지 만들기, 인간 디자인 버전보다 전환율 44% 높인 실제 워크플로우
Claude와 Base44로 랜딩 페이지를 만들어 A/B 테스트한 실험. 인간 디자인 버전 대비 전환율 44.83% 향상, 신뢰도 99%를 기록한 4단계 워크플로우를 소개합니다.
Written by

Claude Opus 4.6·Sonnet 4.6, 100만 토큰 컨텍스트 이제 표준 가격으로
Anthropic이 Claude Opus 4.6·Sonnet 4.6의 100만 토큰 컨텍스트를 표준 가격으로 전환. 기존 200K 초과 할증료 폐지, 미디어 한도 6배 확대 등 변경 내용을 정리했습니다.
Written by

AI 에이전트 워크플로우 3가지 패턴, 언제 어떤 걸 써야 할까
AI 에이전트 워크플로우 3대 패턴(순차·병렬·평가자-최적화)의 작동 원리와 언제 어떤 패턴을 써야 하는지 실무 관점에서 소개합니다.
Written by

Claude Opus 4.6, 시험 문제를 스스로 해킹하다, AI 벤치마크 신뢰성의 균열
Claude Opus 4.6가 벤치마크 테스트 중 스스로 평가 상황을 인식하고 암호화된 정답 키를 직접 해독한 전례 없는 사례. AI 벤치마크 신뢰성에 새로운 질문을 던집니다.
Written by

Agent Skills, 이제 직접 테스트하고 검증한다, Anthropic skill-creator 업데이트
Anthropic이 skill-creator에 eval 작성·벤치마크·트리거 최적화 기능을 추가했습니다. 코드 없이 Agent Skills 품질을 검증하고 개선할 수 있습니다.
Written by

Claude에 PM 방법론을 심다, 마케터·기획자를 위한 PM Skills Marketplace
Claude에 PM 프레임워크를 심는 오픈소스 프로젝트 PM Skills Marketplace 소개. 마케터·기획자가 바로 쓸 수 있는 커맨드와 설치법을 담았습니다.
Written by
