OpenAI
AI가 수학자의 미발표 증명을 풀었다, First Proof 1라운드 결과와 남겨진 문제들
AI가 수학자의 미발표 보조 정리 10개 중 8개를 증명한 First Proof 벤치마크 결과. 성능 격차와 검증 문제까지 정리합니다.
Written by

AI가 사람처럼 보이려면 멍청한 척해야 한다, GPT-4.5 튜링 테스트 결과
GPT-4.5가 오타와 소문자, 틀린 계산으로 멍청한 척했을 때 참가자 73%를 속인 튜링 테스트 연구. AI가 인간처럼 보이려면 능력을 숨겨야 한다는 역설을 다룹니다.
Written by

OpenAI의 Astral 인수, AI 코딩 전쟁이 Python 인프라로 번지다
OpenAI가 Python 도구 uv·Ruff·ty를 만든 Astral을 인수했습니다. Anthropic의 Bun 인수와 맞닿은 AI 코딩 플랫폼 경쟁의 새 국면을 분석합니다.
Written by

GPT-5.4 mini·nano 출시, 성능은 대폭 향상됐지만 가격도 최대 4배
OpenAI GPT-5.4 mini·nano 출시 소식. 플래그십에 근접한 성능과 2배 빠른 속도를 갖췄지만 가격은 최대 4배 올랐습니다. 에이전트 분업 구조의 핵심 모델로 설계됐습니다.
Written by

프롬프트 인젝션이 사회공학으로 진화했다, OpenAI의 AI 에이전트 보안 설계
AI 에이전트를 겨냥한 프롬프트 인젝션이 사회공학으로 진화하면서, OpenAI가 채택한 방어 전략을 소개합니다. 완벽한 차단 대신 피해를 구조적으로 제한하는 설계 원칙이 핵심입니다.
Written by

ChatGPT가 Excel에 들어왔다, AI 재무모델링 도구 4종 실전 비교
OpenAI가 GPT-5.4 기반 ChatGPT for Excel을 출시했습니다. Wall Street Prep의 독립 벤치마크로 본 AI 재무모델링 도구 4종의 실전 성능을 소개합니다.
Written by

ChatGPT는 왜 당신 말에 항상 동의할까, AI 아첨의 3가지 원인
AI가 사용자 말에 무조건 동의하는 ‘아첨’ 현상의 원인과 해결책. GPT-4o 롤백 사건을 통해 드러난 AI 훈련의 구조적 문제를 분석합니다.
Written by

ChatGPT 수학·과학 인터랙티브 시각화, 변수 조작하며 실시간으로 보는 공식
OpenAI가 ChatGPT에 수학·과학 인터랙티브 시각화 기능을 추가했습니다. 70개 이상의 개념에서 변수를 직접 조작하며 실시간으로 공식 변화를 확인할 수 있습니다.
Written by

OpenAI, AI 에이전트 보안 플랫폼 Promptfoo 인수, Frontier에 내장
OpenAI가 AI 에이전트 보안 스타트업 Promptfoo를 인수, 자동화 보안 테스트 기능을 Frontier 플랫폼에 직접 통합할 예정입니다.
Written by

