AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

위키피디아가 AI에게 묻는다: 개방된 지식, 누구를 위한 것인가

위키미디어 재단이 AI와 머신러닝이 인권에 미치는 영향을 평가한 보고서를 발표했습니다. 전 세계에서 가장 신뢰받는 지식 플랫폼이 생성형 AI 시대에 “지식 접근권”을 어떻게 지킬 것인지 선제적으로 고민한 첫 사례입니다.

위키피디아가 던진 질문들

위키미디어 재단은 2024년 독립 연구기관 Taraaz Research에 의뢰해 인권 영향 평가(HRIA)를 실시했습니다. 보고서는 세 가지 영역에서 잠재적 위험을 분석했습니다.

첫째, 위키미디어가 자체 개발한 AI 도구들입니다. 2010년부터 반달리즘 탐지, 인용 필요 표시 등에 머신러닝을 활용해왔는데요. 이런 도구들이 오히려 기존 편향을 증폭시키거나 콘텐츠를 잘못 삭제 표시할 위험이 있다고 지적했습니다.

둘째, 외부 생성형 AI의 위협입니다. ChatGPT 같은 도구가 대규모 허위정보를 빠르게 생성하거나, 위키피디아 편집자들을 타겟으로 한 악의적 콘텐츠를 자동 생성할 수 있다는 겁니다. 여러 언어로 동시에 오정보를 퍼뜨리면 탐지와 조정이 훨씬 어려워집니다.

Wikipedia logo
위키피디아는 2010년부터 AI/ML 도구를 활용해왔지만, 생성형 AI 시대에는 새로운 차원의 질문에 직면했다. (출처: Wikimedia)

셋째, 위키피디아 콘텐츠가 대형 언어모델(LLM) 학습에 사용되는 문제입니다. 위키피디아는 크리에이티브 커먼즈 라이선스로 누구나 자유롭게 사용할 수 있게 공개되어 있습니다. 하지만 이 데이터로 학습된 AI가 편향되거나 부정확한 정보를 생성하면, 결국 위키피디아의 명성에도 영향을 미칩니다.

중요한 점은 이 모든 것이 잠재적 위험이라는 겁니다. 아직 실제로 발생한 피해는 없습니다. 위키미디어는 문제가 커지기 전에 선제적으로 대응하려는 것이죠.

개방성의 역설: 공익이 착취당할 때

여기서 흥미로운 역설이 드러납니다. 위키피디아가 직면한 딜레마는 사실 웹 전체가 겪고 있는 문제이기도 합니다.

웹의 창시자 팀 버너스리는 최근 가디언 기고문에서 “내가 만든 웹을 이제 알아보지 못하겠다”고 토로했습니다. 1993년 CERN이 웹을 무료로 공개한 이유는 명확했습니다. “모든 것을 연결하면, 결국 모든 것이 담긴다.” 전 세계가 자유롭게 지식을 공유하는 공간을 만들고 싶었던 겁니다.

Tim Berners-Lee
웹을 만든 팀 버너스리는 “웹 2.0에서 잘못된 길로 접어들었다”고 경고했다. (출처: Wikimedia Commons)

그런데 30년이 지난 지금, 소수의 거대 플랫폼이 사용자 데이터를 수확해 상업 브로커나 억압적인 정부에 판매합니다. 알고리즘은 디지털 중독을 유도하고, 유해 콘텐츠는 의도적으로 폭력을 선동하고 사회적 결속을 약화시킵니다. 팀 버너스리는 “Web 2.0 소셜미디어가 등장하면서 우리는 잘못된 길로 접어들었다”고 말합니다.

위키피디아도 비슷한 상황입니다. 모두에게 열린 지식을 만들었더니, 그 지식이 폐쇄적인 상업 AI의 학습 데이터가 되어버렸습니다. 공익을 위해 개방했는데 소수가 이익을 취하는 구조. 이게 바로 개방성의 역설입니다.

위키미디어가 선택한 길

그렇다면 어떻게 해야 할까요? 개방성을 포기할 수는 없습니다. 위키미디어 재단은 다른 방법을 택했습니다.

첫째, 투명한 평가입니다. HRIA 보고서를 공개하고 전 세계 커뮤니티와 논의합니다. 문제를 감추지 않고 함께 해결책을 찾겠다는 겁니다.

둘째, 커뮤니티 기반 거버넌스입니다. 위키피디아는 수백만 명의 자발적 편집자들이 만들어가는 플랫폼입니다. AI 정책도 마찬가지입니다. 재단이 일방적으로 결정하지 않고, 각 언어 커뮤니티가 생성형 AI를 어떻게 다룰지 스스로 정하도록 합니다.

셋째, “지식 접근은 인권”이라는 원칙을 지킵니다. 표현의 자유, 교육받을 권리, 정치 참여권. 이 모든 것이 신뢰할 수 있는 정보에 접근할 수 있을 때 가능합니다. 기술이 발전해도 이 원칙만은 흔들리지 않습니다.

팀 버너스리는 Solid라는 탈중앙화 프로젝트를 통해 웹의 구조 자체를 바꾸려 합니다. 사용자가 자기 데이터를 직접 소유하고, 다른 사람이 접근하려면 허가를 받아야 하는 시스템입니다. 위키미디어는 기존 플랫폼을 지키되, 원칙을 타협하지 않는 방식을 선택했습니다.

두 접근법 모두 중요합니다. 구조를 바꾸는 것도, 기존 시스템을 지키는 것도 필요합니다. 빅테크는 CERN처럼 발명을 무료로 공개하지 않습니다. 그래서 비영리 기관과 커뮤니티가 더욱 중요해집니다.

아직 늦지 않았다

위키미디어 재단은 11월에 글로벌 커뮤니티와 온라인 대화를 진행합니다. 보고서의 발견과 권고사항에 대해 각국 편집자들의 의견을 듣겠다는 겁니다.

팀 버너스리의 말처럼 “아직 늦지 않았습니다.” 개방된 지식 생태계를 지키는 건 기술 문제가 아니라 선택의 문제입니다. AI가 소수를 위한 도구가 될지, 모두를 위한 도구가 될지는 지금 우리가 무엇을 선택하느냐에 달려 있습니다.


참고자료


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments