AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

OpenAI의 게임 체인저: gpt-oss 오픈소스 모델과 ChatGPT 최적화 철학

OpenAI가 5년 만에 처음으로 오픈소스 모델 gpt-oss를 공개하며 AI 업계에 신선한 충격을 주고 있습니다. 동시에 ChatGPT의 최적화 방향을 사용 시간이 아닌 사용자의 목표 달성과 웰빙에 두겠다고 발표했습니다.

출처: GitHub

왜 지금 오픈소스인가?

OpenAI가 갑작스럽게 오픈소스 모델을 발표한 배경에는 여러 요인이 있습니다. 가장 큰 이유는 중국 AI 기업들의 급부상입니다. DeepSeek, Alibaba의 Qwen, Moonshot AI 등이 세계 최고 수준의 오픈소스 모델들을 연이어 발표하며 오픈소스 AI 생태계를 주도하고 있습니다.

샘 알트만 CEO는 “우리가 오픈소스 기술에 있어서는 역사의 잘못된 편에 서 있었다”고 인정하며, “2015년 OpenAI를 시작할 때부터 우리의 미션은 모든 인류에게 도움이 되는 AGI를 보장하는 것이었다”고 강조했습니다.

gpt-oss: 단일 GPU에서 실행되는 강력한 추론 모델

gpt-oss는 두 가지 버전으로 출시됩니다:

  • gpt-oss-120b: 1170억 개의 매개변수를 가진 대형 모델로, 단일 H100 GPU에서 실행 가능
  • gpt-oss-20b: 210억 개의 매개변수를 가진 경량 모델로, 16GB 메모리를 가진 일반 노트북에서도 실행 가능

두 모델 모두 Apache 2.0 라이선스로 제공되어 상업적 활용이 자유롭습니다. 기업들은 OpenAI에 별도의 비용을 지불하거나 허가를 받을 필요 없이 이 모델들을 활용해 수익을 창출할 수 있습니다.

기술적 혁신: MXFP4 양자화

가장 주목할 만한 기술적 특징은 MXFP4 양자화 기술입니다. 이 기술을 통해 gpt-oss-120b는 전체 1170억 개의 매개변수 중 실제로는 51억 개의 매개변수만 활성화하여 작동합니다. 이는 메모리 사용량을 대폭 줄이면서도 성능은 유지하는 혁신적인 접근법입니다.

Azure AI Model Catalog에서 제공되는 gpt-oss 모델

성능 비교: 오픈소스 모델 중 최고 수준

OpenAI가 공개한 벤치마크 결과에 따르면, gpt-oss는 다른 오픈소스 모델들을 압도하는 성능을 보여줍니다:

Codeforces 프로그래밍 테스트에서는 gpt-oss-120b가 2622점, gpt-oss-20b가 2516점을 기록하며 DeepSeek의 R1 모델을 능가했습니다.

Humanity’s Last Exam (HLE)에서는 gpt-oss-120b가 19%, gpt-oss-20b가 17.3%의 점수를 기록했습니다. 이는 OpenAI의 자체 o3 모델보다는 낮지만, DeepSeek와 Qwen의 최고 오픈소스 모델들보다는 높은 수준입니다.

실제 활용하기: 간편한 설치와 실행

Transformers 라이브러리 활용

가장 간단한 방법은 Hugging Face의 Transformers 라이브러리를 사용하는 것입니다:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "openai/gpt-oss-20b"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    device_map="auto",
    torch_dtype="auto",
)

messages = [
    {"role": "user", "content": "양자역학을 쉽게 설명해주세요."},
]

inputs = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt",
    return_dict=True,
).to(model.device)

generated = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(generated[0][inputs["input_ids"].shape[-1]:]))

다양한 플랫폼 지원

gpt-oss는 다양한 플랫폼에서 실행할 수 있습니다:

  • Ollama: 일반 소비자용 하드웨어에서 실행
  • vLLM: 프로덕션 환경에서의 고성능 서빙
  • llama.cpp: Metal, CUDA, Vulkan 등 다양한 백엔드 지원
  • LM Studio: 그래픽 사용자 인터페이스 제공

ChatGPT의 새로운 철학: 사용자 웰빙 중심 설계

OpenAI는 ChatGPT의 최적화 방향을 근본적으로 바꾸고 있습니다. 기존의 사용 시간이나 클릭 수 중심에서 벗어나, 사용자가 실제로 목표를 달성했는지에 초점을 맞추고 있습니다.

건강한 AI 사용을 위한 새로운 기능들

휴식 알림 기능: 장시간 사용 시 자연스럽게 휴식을 권하는 알림이 표시됩니다.

개인적 결정 지원 방식 개선: “남자친구와 헤어져야 할까요?”와 같은 질문에 직접적인 답변 대신 사용자가 스스로 생각할 수 있도록 돕는 방식으로 응답합니다.

정신 건강 보호: 90명 이상의 의사들과 협력하여 정신적, 감정적 고통의 징후를 더 잘 감지하고 적절하게 대응할 수 있는 도구를 개발하고 있습니다.

ChatGPT 휴식 알림 기능
ChatGPT의 새로운 휴식 알림 기능. 출처: OpenAI

AI 에이전트와 통합된 경험

새로운 ChatGPT Agent 기능을 통해 사용자가 앱을 직접 사용하지 않고도 목표를 달성할 수 있습니다. 의사 예약, 이메일 요약, 생일 파티 계획 등을 대신 처리해주어, 실제로 앱 사용 시간이 줄어드는 것이 성공의 지표가 됩니다.

AI 업계에 미치는 파급효과

오픈소스 vs 폐쇄형 모델 경쟁 구도 변화

OpenAI의 오픈소스 모델 공개는 AI 업계의 경쟁 구도를 크게 바꿀 것으로 예상됩니다. 그동안 Meta의 Llama 시리즈가 주도했던 오픈소스 AI 시장에 강력한 경쟁자가 등장한 것입니다.

하지만 gpt-oss도 한계가 있습니다. 텍스트 전용 모델이라 이미지나 오디오 처리는 불가능하며, 환각(hallucination) 현상이 OpenAI의 다른 모델들보다 심각합니다. PersonQA 벤치마크에서 gpt-oss-120b는 49%, gpt-oss-20b는 53%의 환각률을 보였는데, 이는 o1 모델의 16%보다 3배 이상 높은 수치입니다.

기업들의 전략적 선택지 확대

Apache 2.0 라이선스로 제공되는 gpt-oss는 기업들에게 새로운 선택지를 제공합니다. 자체 서버에서 모델을 실행하면서도 OpenAI의 클라우드 모델과 연계할 수 있어, 비용 효율성과 성능을 모두 고려한 하이브리드 접근이 가능해졌습니다.

앞으로의 전망

OpenAI의 이번 발표는 단순한 모델 공개를 넘어 AI 업계 전체의 패러다임 변화를 예고합니다. 오픈소스와 폐쇄형 모델의 경계가 모호해지면서, 기업들은 자신의 요구사항에 맞는 최적의 조합을 찾아야 할 것입니다.

또한 AI의 건강한 사용에 대한 OpenAI의 새로운 접근법은 다른 AI 기업들에게도 영향을 미칠 것으로 보입니다. 사용자의 주의를 끌기 위한 경쟁에서 벗어나 실제 가치 창출에 집중하는 방향으로 업계 전체가 움직일 가능성이 높습니다.

gpt-oss 모델은 현재 Hugging Face에서 다운로드할 수 있으며, 다양한 플랫폼에서 즉시 사용 가능합니다. AI 개발자들과 기업들에게는 강력한 오픈소스 모델을 활용할 새로운 기회가, 일반 사용자들에게는 더욱 건강하고 목적지향적인 AI 경험이 제공될 것으로 기대됩니다.


참고자료:


AI Sparkup 구독하기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Comments