약물 개발 10년을 줄일 수 있을까, OpenAI GPT-Rosalind의 도전

2026-04-21

﹒

2 minutes

신약 하나가 세상에 나오기까지 평균 10~15년이 걸립니다. 문제는 과학의 어려움만이 아닙니다. 수십 개의 데이터베이스, 방대한 논문, 실험 데이터를 연구자가 손수 오가며 연결해야 하는 워크플로우 자체가 발목을 잡습니다. OpenAI는 이 구조를 AI로 바꾸겠다며 특화 모델을 꺼내들었습니다.

사진 출처: OpenAI

OpenAI가 4월 16일 생명과학 연구 전용 추론 모델 GPT-Rosalind를 공개했습니다. DNA 이중나선 구조 규명에 기여한 화학자 로절린드 프랭클린의 이름을 따온 이 모델은, 생물학·신약 개발·중개 의학 분야의 연구 워크플로우를 지원하기 위해 설계됐습니다. 단발성 출시가 아닌 “생명과학 모델 시리즈”의 첫 번째라고 OpenAI는 밝혔습니다.

출처: Introducing GPT-Rosalind for life sciences research – OpenAI

범용 모델이 부족했던 이유

기존 GPT 모델도 생명과학 질문에 답할 수 있었지만, 연구 현장에서 요구하는 수준과는 거리가 있었습니다. 분자·단백질·유전자·신호 경로에 대한 정밀한 추론, 여러 단계에 걸친 실험 설계, 전문 데이터베이스와 도구를 오가는 멀티스텝 워크플로우가 그 한계였습니다.

GPT-Rosalind는 이 지점을 정면으로 겨냥해 파인튜닝됐습니다. 문헌 검토, 시퀀스-기능 해석, 실험 계획, 데이터 분석 등 연구자가 실제로 반복하는 작업에 맞춰 설계됐고, OpenAI 내부 평가에서는 화학, 생화학과 단백질 이해, 계통유전학, 실험 설계, 도구 사용 5개 영역 모두에서 GPT-5·GPT-5.2·GPT-5.4를 앞섰습니다.

실제로 무엇을 할 수 있나

모델의 능력을 가장 잘 보여주는 사례는 유전자 치료 기업 Dyno Therapeutics와의 협업입니다. 미공개 RNA 시퀀스를 대상으로 시퀀스-기능 예측 및 생성 과제를 수행했고, 결과를 AI-바이오 분야 인간 전문가 57명의 점수와 비교했습니다. Codex 환경에서 평가한 best-of-10 제출물은 예측 과제에서 인간 전문가 상위 5%, 생성 과제에서 상위 16% 수준의 성과를 기록했습니다.

공개 벤치마크 BixBench(실제 바이오인포매틱스·데이터 분석 기준)에서는 Pass@1 점수 0.751로 공개 점수가 있는 모델 중 1위를 차지했습니다. GPT-5.4(0.732), Grok 4.2(0.698), Gemini 3.1 Pro(0.550)가 뒤를 이었습니다.

모델 혼자가 아닌, 에코시스템으로

GPT-Rosalind의 또 다른 축은 함께 공개된 생명과학 리서치 플러그인입니다. GitHub에서 무료로 내려받을 수 있으며, AlphaFold·BindingDB를 포함한 50개 이상의 공개 멀티오믹스 데이터베이스·문헌 소스·생물학 도구와 연결됩니다.

연구자가 “이 단백질의 구조를 찾고, 관련 논문을 검토하고, 후속 실험을 설계해줘”라는 복합 질문을 던지면, 플러그인이 오케스트레이션 레이어로 작동해 필요한 데이터베이스를 순서대로 활용합니다. 엔터프라이즈 사용자는 GPT-Rosalind와 결합해 쓸 수 있고, 일반 사용자도 기존 OpenAI 모델과 함께 플러그인만 사용할 수 있습니다.

접근은 제한적, 이유도 분명하다

GPT-Rosalind는 누구나 쓸 수 있는 모델이 아닙니다. 현재 미국 내 적격 엔터프라이즈 고객을 대상으로 한 ‘트러스티드 액세스(Trusted Access)’ 프로그램을 통해서만 연구 프리뷰로 제공됩니다.

접근 심사 기준은 세 가지입니다. 공공 이익이 명확한 정당한 과학 연구를 수행하는지, 적절한 거버넌스와 오남용 방지 통제를 갖추고 있는지, 승인된 사용자만 안전하게 관리되는 환경에서 접근하는지입니다.

제한의 배경에는 바이오안보 우려가 있습니다. Ars Technica는 OpenAI가 바이러스 감염성 최적화 같은 요청에 악용될 가능성을 고려해 접근을 통제하고 있다고 전했습니다. 아직 환각(hallucination) 문제가 완전히 해결됐는지도 불분명한 만큼, 성과에 대한 냉정한 검증은 실제 현장 사용 후기가 쌓여야 가능합니다.

도구에서 ‘발견의 파트너’로

OpenAI는 GPT-Rosalind를 단순한 연구 보조 도구가 아닌, 연구자와 함께 “가설에서 증거로, 증거에서 통찰로, 통찰에서 신약으로” 이동하는 파트너로 정의합니다. Los Alamos 국립연구소와는 AI 기반 단백질·촉매 설계를 탐구 중이고, Amgen·Moderna·Allen Institute 등이 이미 파트너로 참여하고 있습니다.

생명과학 분야에서 도메인 특화 AI가 실제로 얼마나 다른 결과를 만들어낼 수 있는지, 첫 번째 시리즈가 그 답의 실마리를 보여줄 수 있을지 주목됩니다. 벤치마크 수치와 현장의 체감이 일치하는지는 원문과 이후 사용 후기에서 확인해 보세요.

참고자료:

OpenAI launches GPT-Rosalind, a reasoning model built for life sciences research – The Decoder
OpenAI starts offering a biology-tuned LLM – Ars Technica
Life Sciences Research Plugin for Codex – GitHub

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

약물 개발 10년을 줄일 수 있을까, OpenAI GPT-Rosalind의 도전

범용 모델이 부족했던 이유

실제로 무엇을 할 수 있나

모델 혼자가 아닌, 에코시스템으로

접근은 제한적, 이유도 분명하다

도구에서 ‘발견의 파트너’로

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

앱을 설치하지 않는 컴퓨터, Microsoft Project Solara가 그리는 에이전트 퍼스트 기기

프론티어 LLM 비용, 11개월이면 역전된다, 로컬 AI의 경제학

Gemma 4 12B, 인코더 없이 멀티모달 처리하는 노트북용 AI 모델

Google AI 검색 opt-out 컨트롤 등장, 웹사이트 운영자가 알아야 할 변화