GPT-5.5는 OpenAI가 2026년 4월 23일 출시한 최신 플래그십 모델이다. 에이전트 코딩, 컴퓨터 사용, 지식 업무, 과학 연구 등 복잡하고 장시간 실행되는 작업에서 전작 GPT-5.4를 크게 능가하면서도 서빙 레이턴시는 동급 수준을 유지한다. ChatGPT(Plus·Pro·Business·Enterprise)와 Codex에서 순차 배포 중이며, API는 곧 제공될 예정이다.
등장 배경
대형 모델은 일반적으로 더 강력한 지능을 위해 속도를 포기한다. GPT-5.5는 이 트레이드오프를 다르게 해결했다. NVIDIA GB200/GB300 NVL72 시스템에 맞게 추론 스택 전체를 재설계하고, Codex를 활용해 로드밸런싱·파티셔닝 휴리스틱을 자동화해 토큰 생성 속도를 20% 이상 향상시켰다. 같은 Codex 작업을 기존보다 적은 토큰으로 완료하므로 비용 효율도 높아졌다.
주요 벤치마크
| 벤치마크 | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| SWE-Bench Pro | 58.6% | – | – | – |
| GDPval (wins or ties) | 84.9% | 83.0% | 80.3% | 67.3% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | – |
| BrowseComp | 84.4% | 82.7% | 79.3% | 85.9% |
| FrontierMath Tier 1–3 | 51.7% | 47.6% | 43.8% | 36.9% |
| Tau2-bench Telecom | 98.0% | – | – | – |
핵심 능력
에이전트 코딩
- Terminal-Bench 2.0 82.7%: 복잡한 CLI 워크플로, 계획-반복-도구 조율 필요 과제에서 최고점
- Expert-SWE (내부 벤치마크): 숙련 엔지니어 20시간 소요 과제에서도 GPT-5.4 초과
- Codex에서 대규모 시스템 전반 변경 사항을 “한 번에” 처리, 브랜치 병합·아키텍처 개선 수행 능력 검증
- Artificial Analysis Coding Index에서 경쟁 모델 대비 절반 비용으로 최고 지능 달성
지식 업무·컴퓨터 사용
- GDPval 84.9%: 44개 직종에 걸친 지식 업무 생산물 평가에서 최고점
- OSWorld-Verified 78.7%: 실제 컴퓨터 환경 자율 조작
- 문서·스프레드시트·슬라이드 생성, 웹 검색·코드 실행·도구 전환 조율 가능
- ChatGPT에서 GPT-5.5 Thinking 모드로 복잡한 분석·문서 집약 업무 지원
과학 연구
- GeneBench(유전학·정량 생물학 데이터 분석)에서 GPT-5.4 대비 명확한 향상
- BixBench(생물정보학)에서 공개 점수 모델 중 선두
- Ramsey 수에 관한 신규 수학적 증명 발견 (Lean으로 검증 완료)
GPT-5.5 Pro
Pro, Business, Enterprise 사용자에게 함께 배포된 GPT-5.5 Pro는 BrowseComp 90.1%, FrontierMath Tier 4 39.6% 달성. 테스터들이 업무 복잡도와 응답 품질 모두에서 GPT-5.4 Pro 대비 유의미한 개선을 보고했다.
사이버보안 고려 사항
GPT-5.5는 OpenAI의 Preparedness Framework에서 High 사이버보안 역량으로 분류된다. CyberGym에서 81.8%를 기록하며 취약점 발견·패치 능력이 강화됐다. 이에 따라:
- GPT-5.2 대비 강화된 사이버 분류기 적용
- chatgpt.com/cyber에서 검증 사용자 신뢰 접근(Trusted Access) 신청 가능
- 사이버보안 비허용 모델(
GPT-5.4-Cyber)은 중요 인프라 방어 조직에 별도 제공
접근 방법
- ChatGPT: Plus·Pro·Business·Enterprise에서 GPT-5.5 및 GPT-5.5 Pro 사용 가능
- Codex: 에이전트 코딩 워크스페이스에서 GPT-5.5 기본 모델로 설정
- API: 조만간 제공 예정 (안전 요건 충족 파트너와 협력 중)
사용 대상 및 케이스
- 소프트웨어 엔지니어링 팀: Codex에서 GPT-5.5를 활용해 장시간 이슈 해결, 테스트·검증 자동화
- 지식 업무 자동화: 재무 분석, 법률 문서 검토, 주간 보고서 자동 생성 등 반복 업무 위임
- 과학 연구자: 데이터 분석 파이프라인 구축 및 실험 결과 해석에 공동 연구자로 활용
관련 문서
- gpt-5-4 — 전작 GPT-5.4와 비교
- chatgpt-workspace-agents — ChatGPT 내 Codex 기반 워크스페이스 에이전트
참고 자료
- Introducing GPT-5.5 — OpenAI (2026-04-23)