많은 질병이 ‘치료 불가능’한 이유는 약물을 만들 수 없어서가 아닙니다. 약물이 결합해야 하는 표적 단백질의 구조가 너무 복잡하거나 특이해서, 거기에 딱 맞는 단백질을 설계할 수 없기 때문이죠. 하지만 MIT 연구팀이 공개한 생성형 AI 모델 BoltzGen은 이런 ‘불가능한’ 표적들을 상대로 새로운 단백질 약물 후보를 만들어낼 수 있습니다.

MIT 박사과정생 Hannes Stärk가 주도한 이 연구는 2025년 10월 26일 공개되었습니다. BoltzGen은 단순히 단백질 구조를 예측하는 것을 넘어, 특정 질병 표적에 결합할 수 있는 완전히 새로운 단백질을 생성해냅니다. 무엇보다 8개의 실제 연구실에서 26개의 어려운 표적을 대상으로 검증을 마쳤고, 약물 개발 파이프라인에 바로 투입할 수 있는 수준이라는 평가를 받았습니다.
출처: MIT scientists debut a generative AI model that could create molecules addressing hard-to-treat diseases – MIT News
기존 모델은 왜 실패했을까
대부분의 AI 모델은 단백질 구조 예측이나 단백질 설계 중 하나만 잘합니다. 더 큰 문제는 ‘쉬운’ 표적에만 효과적이라는 점이었죠. 마치 학생이 숙제와 비슷한 문제는 잘 풀지만, 전혀 새로운 유형의 문제 앞에선 무너지는 것과 같습니다.
기존 모델들은 훈련 데이터와 비슷한 표적에만 작동했습니다. 이미 결합 단백질(binder)이 알려진 표적으로만 평가받았기 때문에, 정말 어려운 표적 앞에선 성능이 급락했어요.
BoltzGen은 세 가지 혁신으로 이 한계를 돌파했습니다. 첫째, 단백질 설계와 구조 예측을 동시에 수행하는 다목적 모델입니다. Stärk는 “더 일반적인 훈련 방식으로 물리 법칙을 더 잘 학습한다”고 설명합니다. 둘째, 실제 실험실 연구자들의 피드백을 반영해 물리학과 화학 법칙을 위반하지 않는 단백질만 생성하도록 제약을 걸었습니다. 셋째, 26개의 까다로운 표적을 대상으로 엄격한 검증을 진행했는데, 여기엔 치료적으로 중요한 케이스부터 훈련 데이터와 전혀 다른 표적까지 포함됐습니다.
산업계를 흔드는 오픈소스 공개
BoltzGen의 전신인 Boltz-2는 올여름 단백질 결합 친화도 예측으로 주목받았습니다. 이번 BoltzGen은 여기서 한 단계 더 나아가 실제 약물 후보를 설계하는 최초의 모델이 되었죠.
산업계 협력사 중 하나인 Parabilis Medicines는 “BoltzGen을 우리의 기존 플랫폼에 통합하면 중요한 인간 질병에 대한 혁신적 약물 개발이 가속화될 것”이라고 평가했습니다.
하지만 오픈소스 공개는 양날의 검이기도 합니다. LabGenius의 머신러닝 과학자 Justin Grace는 X(구 트위터)에서 날카로운 질문을 던졌습니다. “챗 AI 시스템의 경우 상용 버전과 오픈소스 버전의 성능 격차가 7개월로 줄어들고 있다. 단백질 분야는 더 짧아 보인다. 몇 달만 기다리면 무료 버전이 나오는데, 유료 서비스 회사들이 어떻게 투자금을 회수할 수 있을까?”
불가능을 가능으로 만드는 도구
MIT Jameel Clinic의 AI 책임자이자 공동 저자인 Regina Barzilay 교수는 “학생들이 자주 묻는다. AI가 치료제 개발에서 판도를 바꿀 수 있는 부분이 어디냐고”라며, “아직 풀리지 않은 문제에 집중하지 않으면 판도를 바꿀 수 없다. 이것이 Hannes의 연구를 다른 연구와 구별하는 지점”이라고 강조했습니다.
공동 저자인 Tommi Jaakkola 교수는 “BoltzGen 같은 완전 오픈소스 모델이 커뮤니티 전체의 약물 설계 역량을 가속화한다”고 평가했습니다.
Stärk는 미래를 이렇게 그립니다. “질병을 해결하기 위해 생물학을 조작하거나, 아직 상상하지 못한 작업을 분자 기계로 수행하는 도구를 만들고 싶습니다. 생물학자들이 이전엔 생각조차 하지 못했던 것을 상상할 수 있게 만드는 도구를요.”
300명이 넘는 학계와 산업계 인사가 10월 30일 BoltzGen 세미나에 몰려들었던 이유가 여기 있습니다. 불가능했던 표적들이 이제 가능성의 영역으로 들어왔으니까요.

답글 남기기