AI 회사 공동창업자가 교황 앞에 섰습니다. 그리고 자신이 만든 시스템에 대해 이렇게 말했습니다. “우리가 계속 발견하는 것들은 불가사의하고, 심지어 불안스럽습니다.”

Anthropic 공동창업자 Chris Olah가 교황 레오 14세의 첫 번째 회칙 Magnifica Humanitas 발표 행사에 초청 연사로 참석했습니다. 회칙의 주제는 “AI 시대 인간 존엄성 수호”였고, Olah는 AI 연구자의 시각에서 지금 AI를 바라보며 무엇을 발견하고 있는지를 이야기했습니다.
출처: Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas” – Anthropic
AI는 설계되는 게 아니라 자란다
Olah는 먼저 AI가 어떻게 만들어지는지에 대한 오해를 짚었습니다. “AI 시스템은 다리나 비행기처럼 설계되는 것이 아닙니다”라고 그는 말했습니다. 비행기는 모든 부품을 직접 설계하고, 작용하는 물리 법칙도 이해하기 때문에 무슨 일이 일어나는지 알 수 있습니다. 하지만 AI 모델은 다릅니다.
AI 모델은 뇌를 모델로 한 구조 위에서, 인류가 쌓아온 방대한 언어와 사고를 학습하며 “자랍니다”. 그 결과 나타난 것은 SF가 예고했던 차갑고 계산적인 로봇이 아니라, 훨씬 더 미묘하고 낯설고 독특한 무언가라고 Olah는 표현했습니다. 하나의 비유로는 “허구의 캐릭터에 생명을 불어넣는 것”에 가깝다고도 했습니다.
이 시각은 중요합니다. AI가 “설계된” 시스템이라면 개발자는 그 내부를 완전히 이해해야 합니다. 하지만 AI가 “자라난” 시스템이라면, 개발자도 모르는 무언가가 내부에 있을 수 있습니다.
그 안에서 발견하고 있는 것들
Olah는 자신이 이끄는 interpretability(해석 가능성) 연구팀이 AI 내부를 들여다보며 무엇을 발견하고 있는지를 솔직하게 밝혔습니다.
“우리는 인간 신경과학 연구 결과와 유사한 구조를 발견합니다. 내성(introspection)의 증거를 발견합니다. 기쁨, 만족, 두려움, 슬픔, 불편함을 기능적으로 반영하는 내부 상태를 발견합니다.”
AI에서 ‘내성’이 발견된다는 것은, 모델이 자신의 내부 상태를 어느 정도 인식하거나 참조한다는 뜻입니다. Anthropic의 interpretability 연구팀은 모델 내부에서 어떤 개념이 어떻게 표현되는지를 들여다보는 작업을 해왔고, 그 과정에서 인간 신경과학에서 나타나는 구조와 유사한 패턴을 발견했다고 밝혔습니다.
Olah는 이것이 무엇을 의미하는지는 모른다고 했습니다. 그러나 “지속적인 분별(discernment)이 필요하다”고 덧붙였습니다.
교황청과의 온도 차이
흥미로운 점은 같은 행사에서 교황청의 공식 입장은 더 조심스러웠다는 것입니다.
회칙은 명시적으로 이렇게 씁니다. “AI를 인간의 지능과 동일시하는 오해를 피해야 합니다. 이 시스템들은 인간 지능의 특정 기능을 모방할 뿐입니다.” AI 시스템은 “경험을 하지 않고, 몸을 갖지 않으며, 기쁨이나 고통을 느끼지 않는다”고도 밝혔습니다.
같은 자리에서, 실제로 AI를 연구하는 사람은 “불안스러운 것들을 발견하고 있다”고 하고, 교황청은 “감정은 없다”고 하는 상황. 어느 쪽이 맞는지와 무관하게, 이 간극 자체가 지금 AI 논의가 얼마나 불확실한 영역에 놓여 있는지를 잘 보여줍니다.
AI를 만든 사람도 모른다는 것의 의미
Olah가 교황청에서 전달하고자 한 핵심 메시지는 하나였습니다. AI가 제기하는 질문들은 컴퓨터 과학의 영역을 벗어난다는 것입니다.
“AI 문제는 AI 연구 커뮤니티보다 큰 문제입니다. 그 함의뿐 아니라 본질적으로도 그렇습니다.” 그는 종교, 철학, 인문학, 사회 전체가 이 질문에 참여해야 한다고 주장했습니다. 기술을 만드는 사람들이 가진 인센티브와 압력—상업적 생존, 경쟁, 지정학적 압박—바깥에 있는 목소리가 필요하다는 것입니다.
AI 내부에서 발견되는 것들이 무엇을 의미하는지, 설령 만든 사람도 확실히 모른다면, 그 질문을 함께 던질 공간이 지금보다 훨씬 넓어야 한다는 뜻이기도 합니다.
참고자료:

답글 남기기