GPT-5.4가 나온 지 한 달 만입니다. OpenAI는 어제(4월 23일) 또 한 번 새 모델을 공개했습니다. 그리고 이번에는 단순한 점진적 개선이 아니라는 평가가 나옵니다.

GPT-5.5는 OpenAI가 자체적으로 “지금까지 만든 모델 중 가장 스마트하고 직관적”이라고 설명하는 신규 모델입니다. 와튼스쿨 교수이자 AI 연구자인 Ethan Mollick은 얼리 엑세스로 직접 써본 뒤 이렇게 표현했습니다. “AI가 아직 발전이 끝나지 않았다는 것을 보여주는 신호.”
출처: Introducing GPT-5.5 – OpenAI
더 빠르게, 더 적은 토큰으로
GPT-5.5의 특이한 점 하나는 더 똑똑해지면서도 속도를 잃지 않았다는 겁니다. 보통 성능이 올라가면 응답이 느려지는데, OpenAI는 NVIDIA GB200 NVL72 시스템에 최적화된 추론 인프라를 새로 설계하면서 GPT-5.4와 유사한 응답 속도를 유지했습니다. 동일한 Codex 작업을 완료하는 데 필요한 토큰 수도 GPT-5.4 대비 줄었습니다. 빠르고, 더 정확하고, 더 효율적입니다.
코딩: “개념적 명확성”이 달라졌다
에이전틱 코딩 분야에서 GPT-5.5의 변화가 가장 뚜렷합니다. 복잡한 커맨드라인 작업을 평가하는 Terminal-Bench 2.0에서 82.7%를 기록했는데, GPT-5.4가 75.1%였던 점과 비교하면 눈에 띄는 도약입니다.
수치보다 더 흥미로운 건 실제 사용자들의 반응입니다. 뉴스레터 Every의 창업자 Dan Shipper는 몇 날을 씨름하다 숙련된 엔지니어에게 맡겼던 버그 수정을 GPT-5.5에 테스트했습니다. GPT-5.4는 같은 수준의 리라이트를 내놓지 못했고, GPT-5.5는 해냈습니다. 그는 이를 “내가 써본 첫 번째 코딩 모델로, 진짜 개념적 명확성이 있다”고 표현했습니다.
코드를 짜는 것과 시스템을 이해하는 것은 다릅니다. GPT-5.5는 코드베이스 전반에서 문제의 원인과 파급 범위를 스스로 파악하고, 수정이 필요한 다른 부분까지 추적하는 능력이 강해졌습니다.
학술 연구: 논문 작성이 어디까지 가능한가
Mollick은 크라우드펀딩 연구자로서 10년째 손대지 못한 데이터 파일 수백 개를 Codex에 올렸습니다. 가설 설정, 통계 분석, 문헌 검토, 논문 포맷까지 맡겼습니다. 프롬프트는 총 4번. 결과물을 본 그는 “박사 2년차가 제출했다면 만족스러웠을 수준”이라고 평가했습니다. 인용된 논문도 실재하고, 통계 방법도 정교했습니다. 아쉬운 건 가설이 그다지 흥미롭지 않았다는 것이었는데, 이는 데이터를 이해하는 AI의 한계가 아니라 새로운 질문을 만들어내는 창의성의 한계였습니다.
OpenAI도 비슷한 사례를 공개했습니다. 면역학 교수 Derya Unutmaz는 GPT-5.5 Pro를 이용해 62개 샘플, 28,000개 유전자 데이터를 분석하고 연구 보고서를 만들었습니다. 그의 팀이 수개월 걸릴 작업이었습니다. 수학 분야에서는 내부 버전의 GPT-5.5가 조합론의 오래된 미해결 문제인 라므시 수(Ramsey number)에 대한 새로운 증명을 찾아내는 데 기여했습니다.
한계는 여전히 존재한다
Mollick은 성능 향상과 함께 한계도 솔직하게 서술했습니다. 그는 GPT-5.5에게 직접 창작한 세계관을 바탕으로 101페이지짜리 롤플레잉 게임 룰북을 만들게 했습니다. 레이아웃, 삽화, 플레이테스트 시뮬레이션까지 포함한 결과물은 기술적으로는 인상적이었지만, 글쓰기 자체는 달랐습니다. 모든 캐릭터가 비슷한 말투를 썼고, 산문이 과하게 장식적이었으며, 등장인물 이름이 반복됐습니다. AI가 코드를 짜고 데이터를 분석하는 속도와 질은 빠르게 높아지고 있지만, 장편 픽션에서 진짜 목소리를 만들어내는 것은 여전히 다른 문제입니다.
모델-앱-하네스로 보는 GPT-5.5
Mollick은 AI를 이해하는 데 유용한 프레임을 제안합니다. 모델(GPT-5.5 같은 AI 자체), 앱(ChatGPT, Claude.ai 등 실제 사용하는 인터페이스), 하네스(AI가 사용하는 도구와 연결 방식)의 세 가지를 함께 봐야 한다는 것입니다. GPT-5.5는 세 영역에서 동시에 발전했습니다. 모델 자체가 더 강해졌고, Codex라는 앱이 더 유능한 에이전트 환경이 됐으며, 이미지 생성이나 코드 실행 같은 도구 활용도 정밀해졌습니다.
AI 발전의 가속도가 느려질 것이라는 예측과 달리, 지금 현장에서는 오히려 반대 신호가 보이고 있습니다.
참고자료: Sign of the future: GPT-5.5 – Ethan Mollick, One Useful Thing

답글 남기기