AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI 연구자의 113편 논문 파문: 학술계를 잠식하는 AI 슬롭의 역설

1년에 논문 113편을 쓸 수 있을까요? 하루에 3편씩 쓴다고 해도 365편이니, 이론적으로는 가능할까요? UC Berkeley의 컴퓨터공학 교수 Hany Farid는 이렇게 말합니다. “저는 1년에 100편의 기술 논문을 꼼꼼히 읽을 수도 없습니다. 그런데 한 저자가 1년 동안 100편이 넘는 기술 논문의 연구와 작성에 참여했다고 주장하는 걸 알고는 깜짝 놀랐죠.”

사진 출처: Alexander Spatari/Getty Images via Scientific American

Scientific AmericanThe Guardian의 최근 보도에 따르면, AI 기술이 학술 연구 생태계를 파괴하고 있습니다. 국제적십자위원회(ICRC)는 AI 챗봇들이 존재하지 않는 학술지와 아카이브 참조를 만들어내고 있다며, AI로부터 받은 아카이브 참조는 부정확할 수 있다고 공식 경고를 발표했습니다. Scientific American은 OpenAI의 ChatGPT, Google의 Gemini, Microsoft의 Copilot이 이런 문제를 일으키는 주요 모델들이라고 보도했죠. 더 아이러니한 건 AI 연구 분야 자체가 AI로 양산된 저질 논문(AI slop)으로 질식하고 있다는 점입니다.

출처: AI Slop Is Spurring Record Requests for Imaginary Journals – Scientific American

존재하지 않는 저널을 찾는 사람들

Journal of International Relief라는 학술지를 들어보셨나요? International Humanitarian Digital Repository는요? 이 둘의 공통점은 실제로 존재하지 않는다는 겁니다.

하지만 주요 AI 모델들은 이런 가짜 자료를 당당하게 인용하고 있습니다. ICRC는 “AI 모델들이 부정확하거나 조작된 아카이브 참조를 생성하고 있다”며 공식 경고를 발표했죠. 문제는 이게 단순히 잘못된 정보를 제공하는 수준을 넘어선다는 겁니다.

Library of Virginia의 연구자 지원 담당 Sarah Falls에 따르면, 현재 이메일로 받는 자료 요청의 15%가 ChatGPT가 생성한 것으로 추정됩니다. 그중 일부는 환각으로 만들어진 인용을 포함하고 있죠. “저희 직원들에게는 특정 기록이 존재하지 않는다는 걸 증명하는 게 훨씬 더 어렵습니다”라고 Falls는 말합니다. 도서관은 이제 연구자들에게 출처를 검증하고 AI에서 나온 정보인지 밝히도록 요청할 계획입니다.

1년에 113편의 논문

더 심각한 문제는 AI 연구 분야 내부에서 벌어지고 있습니다. UC Berkeley에서 최근 컴퓨터공학 학사를 받은 Kevin Zhu는 올해 AI 관련 논문 113편을 발표했다고 주장합니다. 이 논문들의 상당수는 그가 운영하는 Algoverse라는 유료 교육 프로그램(12주 과정에 3,325달러)의 참가자들과 공동 저자로 작성된 것이죠.

Farid 교수는 Zhu의 논문을 “재앙”이라고 평가했습니다. “그가 이 논문들에 의미 있게 기여했을 리 없습니다.” Zhu는 The Guardian과의 인터뷰에서 AI 사용 여부를 명확히 밝히지 않았지만, “참고문헌 관리자, 맞춤법 검사, 때로는 언어 모델을 편집이나 명료성 개선에 사용하는” 표준 생산성 도구를 썼다고 말했습니다.

문제는 그가 혼자가 아니라는 겁니다. AI 분야의 주요 학회 중 하나인 NeurIPS에 제출된 논문은 2020년 1만 건 미만이었지만, 올해는 2만1천5백 건이 넘었습니다. Zhu의 논문만 해도 이번 주 NeurIPS에서 89편이 발표됩니다. 폭증하는 제출량 때문에 NeurIPS는 이제 박사과정 학생들에게 논문 심사를 맡기고 있죠.

신호 대 잡음 비율 1:1

“평균적인 독자로서 과학 문헌에서 무슨 일이 벌어지는지 이해할 기회는 없습니다. 신호 대 잡음 비율이 기본적으로 1입니다.” Farid 교수의 말입니다. 그는 이제 학생들에게 AI 분야에 진입하지 말라고 조언한다고 합니다. “젊은 사람들이 AI에 들어가고 싶어 하는데, 그냥 엉망진창이에요. 따라잡을 수도, 논문을 출판할 수도, 좋은 연구를 할 수도, 신중하게 작업할 수도 없습니다.”

AI 도구는 이미 학계 전반에 깊숙이 침투했습니다. ChatGPT는 여전히 존재하지 않는 출처를 만들어내는 환각을 일으키고, 이런 가짜 인용들이 명망 있는 학술지의 동료 심사를 통과하기도 하죠. 심지어 일부 저자들은 AI 기반 심사자를 속이기 위해 논문에 숨겨진 텍스트를 삽입하는 꼼수까지 쓰고 있습니다.

가장 아이러니한 건 AI 연구 자체가 AI 기술에 의해 무너지고 있다는 점입니다. Farid는 이런 현상을 “vibe coding”(AI 도구로 빠르게 소프트웨어를 만드는 무모한 태도를 가리키는 신조어)이라고 불렀습니다. 질보다 양을 추구하는 연구자들이 늘어나면서, 진짜 혁신적인 연구는 수천 편의 슬롭 속에 묻히고 있습니다.

이 추세가 계속된다면 AI 연구는 얼마나 버틸 수 있을까요? 그리고 차세대 AI 과학자들에게 이건 무엇을 의미할까요? 한 분야가 자기가 만든 기술에 의해 잠식당하는 모습을 지켜보는 건 섬뜩한 일입니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다