AI Sparkup

복잡한 AI 세상을 읽는 힘

AI는 왜 새로운 아이디어를 내지 못할까?

인간의 창의성과 인공지능의 관계를 묘사한 이미지 (출처: Unsplash)

놀라운 질문: AI는 왜 진정한 혁신이 어려울까?

인공지능, 특히 ChatGPT와 같은 대규모 언어 모델(LLM)이 인상적인 글과 코드를 생성할 수 있게 되면서, 흥미로운 질문이 제기되고 있습니다. 인간들은 정기적으로 서로 다른 영역의 통찰력을 결합하여 흥미로운 새로운 아이디어를 만들어내는데, 왜 AI는 아직 주목할 만한 새로운 아이디어를 내놓지 못하는 걸까요? 인간보다 훨씬 더 광범위한 지식에 접근할 수 있는 AI가 혁신적인 아이디어를 생성하지 못하는 이유는 무엇일까요?

이 질문은 인공지능의 본질적 한계와 인간 창의성의 고유한 특성에 대해 생각해보게 합니다. 물론 AI가 발전함에 따라 이러한 한계를 뛰어넘을 수 있을지도 모릅니다. 하지만 현재로서는 AI가 진정으로 독창적인 아이디어를 생성하는 데 어려움을 겪고 있는 이유를 분석해볼 필요가 있습니다.

AI는 구조적으로 혁신이 불가능할까?

AI 회의론자들은 종종 새로운 아이디어를 생성하지 못하는 것이 언어 모델의 본질적 특성이라고 주장합니다. 이들의 주장은 언어 모델이 훈련 데이터에서 본 모든 토큰을 기반으로 다음에 가장 가능성이 높은 토큰을 예측하는 방식으로 작동하기 때문에, 구조적으로 이미 훈련 중에 보았던 것만 출력하도록 설계되어 있다는 것입니다. 따라서 진정으로 새로운 아이디어를 생성하는 것은 불가능하며, 기껏해야 인간이 이미 가졌던 아이디어를 재구성하거나 재조합할 수 있을 뿐이라는 것이죠.

그러나 이 주장은 설득력이 떨어집니다. 새로운 아이디어를 떠올리는 것은 마법이 아닙니다. 영감은 형이상학적 영역에서 비롯되는 신비로운 빛이 아닙니다. 사람들은 이미 가졌던 아이디어를 재구성하고 재조합함으로써 새로운 아이디어를 얻습니다 – 언어 모델과 비슷한 방식으로요.

J.R.R. 톨킨의 비유를 빌리자면, 이는 “마음의 낙엽층”이라는 무의식적 과정을 통해 이루어집니다. 언어 모델도 상당한 규모의 정신적 ‘낙엽층’을 갖고 있거나 (적어도 이론적으로는) 그것을 구성할 수 있어야 합니다.

인간도 마찬가지로 자신의 훈련 데이터에 의해 제한됩니다. 나는 내가 읽거나 경험한 것과 완전히 별개인 아이디어를 가질 수 없습니다. 아이디어를 갖는 전체 과정은 내 경험을 새로운 것으로 결합하는 과정입니다. 기본 언어 모델(친절한 어시스턴트로 형성되기 전)을 사용해 본 적이 있다면, 모델의 출력이 급격한 주제 변화, 인용구, 에코 등이 모두 함께 섞인 인간의 의식의 흐름과 매우 유사하다는 것을 알게 될 것입니다. 이러한 흐름에서 때때로 좋은 아이디어가 나올 수 있다는 것은 매우 그럴듯해 보입니다.

창의적 사고는 기존 지식의 재조합과 재구성을 통해 이루어진다 (출처: Unsplash)

언어 모델이 아직 새로운 아이디어를 내지 못한 이유는?

언어 모델이 이론적으로 새로운 아이디어를 가질 수 있고, 그렇게 다양한 지식을 활용할 수 있다면, 왜 아직 새로운 아이디어를 제시하지 못했을까요? 우선 질문해봐야 할 것은: 언어 모델이 정말로 새로운 아이디어를 가진 적이 없을까요?

사소한 의미에서, 많은 사람들이 언어 모델이 새로운 아이디어를 내는 것을 경험했습니다. 누군가 블로그 초안에 대한 피드백을 요청할 때, 모델의 응답은 필연적으로 모두 새로운 아이디어입니다. 왜냐하면 그 초안을 다른 사람이 읽은 적이 없기 때문입니다. 마찬가지로, 내가 작성 중인 코드에서 버그를 발견하고 수정할 때도 새로운 아이디어라고 할 수 있습니다. 그러나 이는 사람들이 LLM 창의성에 대해 이야기할 때 말하는 종류의 새로운 아이디어는 아닙니다.

연구자들은 같은 종류의 “새로운 아이디어”를 자신의 연구에서 지적할 수 있을 것입니다. 학자들은 연구를 위해 LLM을 점점 더 많이 사용하고 있습니다(주로 데이터 수집을 위해, 그러나 일반적인 대화와 분석을 위해서도). 그러나 이것은 여전히 사람들이 LLM 창의성에 대해 이야기할 때 의미하는 바가 아닙니다. LLM이 “유레카 순간”을 생성할 수 있을까요?

몇 가지 사례가 있습니다. 2023년, GPT-4 기반 시스템이 조합론에서 몇 가지 새로운 결과를 발견했습니다. 또한 한 연구에 따르면 LLM이 생성한 아이디어가 인간이 생성한 아이디어보다 “더 새롭다”고 합니다. GPT-4를 실험 설계에 연결하는 것도 새로운 연구를 생산한다고 합니다.

하지만 이러한 사례들 중 어느 것도 특별히 설득력이 있어 보이지 않습니다. 연구에서 “더 새로운” 아이디어는 좋거나 유망하지 않고, 단지 인간의 아이디어보다 더 무작위적이었을 뿐입니다(매드립스 스타일의 “X로 Y를 하라”와 같은 아이디어). 그리고 검증자가 부착된 GPT 기반 연구 시스템은 무작위 검색과 너무 비슷해 보입니다.

언어 모델이 새로운 아이디어를 낼 수 있을까?

언어 모델이 구조적으로 새로운 아이디어를 갖는 것이 막혀 있지 않지만 아직 그런 아이디어를 갖지 못했다면, 무엇이 부족한 걸까요?

한 가지 답변은 유레카 순간이 자기 성찰 중에 일어나지 않는다는 것입니다. 원래의 유레카 순간은 목욕탕에서의 (우연한) 물리적 실험 중에 발생했습니다. 일반적으로 큰 아이디어는 실제 세계에서 실험을 수행하고 놀랍게도 성공적인 것을 보는 데서 나올 수 있습니다. 따라서 모델에게 떠나서 새로운 아이디어를 고립된 상태에서 생각해내라고 요청하는 것은 불공정할 수 있습니다.

아르키메데스의 유레카 순간 – 물리적 실험에서 영감을 얻은 사례 (출처: Wikipedia)

이에 대한 가장 강력한 반례는 수학 분야입니다. 언어 모델이 실험실에서 실험을 수행할 수 없더라도 혼자서 수학을 할 수 없는 것을 막는 것은 없습니다. 그러나 언어 모델은 아직 진정으로 흥미로운 수학적 결과를 내놓지 못했습니다. 두 번째 반론은 LLM이 테스트될 수 있는 유망한 아이디어 후보를 생성할 것으로 기대할 수 있지만, 그것도 아직 일어나지 않은 것 같습니다.

두 번째 답변은 필요한 스캐폴딩(구조적 지원)이 아직 구축되지 않았다는 것일 수 있습니다. 언어 모델이 인간의 의식의 흐름과 비슷한 것을 생성한다면, 새로운 아이디어를 생성하는 것은 공학적 문제로 해결될 수 있습니다. 올바른 사고 과정으로 모델에게 새로운 아이디어를 생각해내도록 요청하고, 잠재적 지식에서 적절한 맥락 조합을 표면화하도록 하면, 아이디어를 생성하는 기계가 될 수 있습니다. 제가 알기로는 이 분야에서 상당한 탐구가 이루어지지 않았습니다 – 확실히 코드 작성이나 기존 코드베이스 이해를 돕는 언어 모델을 스캐폴딩하는 프로젝트의 폭발과 같은 것은 없었습니다. 아마도 이것은 단지 공학적인 문제일 수 있습니다.

인간과 AI 창의성의 비교

이 문제를 더 깊이 이해하기 위해, 인간과 AI의 창의성을 직접 비교한 연구들도 주목할 만합니다. 심리학 투데이(Psychology Today)에 실린 최근 연구에 따르면, 몇 가지 창의성 측정 지표에서 AI(GPT-4)가 인간보다 높은 점수를 받는 경우도 있었습니다.

이 연구는 네 가지 창의적 과제(대안적 용도 과제, 결과 과제, 발산적 연관 과제, 시각적 조합 과제)를 통해 인간과 AI의 창의성을 비교했습니다. 놀랍게도, AI는 독창성과 정교함 면에서 인간보다 우수한 성과를 보였습니다. 예를 들어, 포크의 새로운 용도를 묻는 질문에 인간은 간단히 “머리빗으로”라고 대답한 반면, AI는 더 상세하고 복잡한 설명을 제공했습니다.

그러나 이러한 측정이 창의성의 본질을 정말로 포착하는지에 대한 의문이 남아 있습니다. 창의성의 가장 순수한 형태는 종종 단순한 언어적 또는 개념적 참신함을 넘어서는, 독특하게 인간적인 것의 표현으로 여겨집니다. AI가 생성한 아이디어가 아무리 독창적이거나 복잡하더라도, 인간 창의성이 본질적으로 가지고 있는 깊이, 의도성, 감정적 공명이 부족할 수 있다는 우려가 있습니다.

결론: 미해결된 수수께끼

언어 모델이 새로운 아이디어를 떠올리지 못하는 것은 다소 놀랍습니다. 영감이 초자연적이라는 주장에 설득력이 없기 때문에, 구조적으로 불가능하다는 주장을 믿지 않습니다. 그러나 확실히 오늘날 언어 모델에서 비롯된 훌륭한 아이디어는 많지 않습니다.

아마도 이것은 물리적 실험이 필요한 체화 문제일 수 있지만, 그것은 수학적 진전의 부족을 설명하지 못합니다. 이것은 공학적 문제일 수 있습니다. 누군가는 좋은 아이디어 스캐폴딩, 즉 “새로운 아이디어를 가져라”에 해당하는 Devin이나 Cursor와 같은 것을 구축해야 합니다.

또한 우리는 창의성의 본질에 대해 더 깊이 생각해볼 필요가 있습니다. 아마도 기술적 혁신은 단순히 더 많은 아이디어를 생성하는 능력이 아니라 가치 있는 아이디어를 식별하고 선택하는 능력에 더 많이 의존할 수 있습니다. 이 관점에서 인간과 AI의 창의적 협업 가능성을 모색하는 것이 더 생산적일 수 있습니다.

인공지능 발전의 다음 단계가 단순한 정보 처리를 넘어 진정한 창의성의 영역으로 나아갈 수 있을지, 아니면 창의적 혁신이 여전히 인간 지능의 고유한 영역으로 남을지는 앞으로 지켜봐야 할 흥미로운 질문입니다.


참고자료:

Comments