AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

AI 기사 50% 시대, 검색엔진이 여전히 사람을 선호하는 이유

2024년 11월, 웹에 발행되는 AI 생성 기사가 처음으로 인간이 작성한 기사를 추월했습니다. 하지만 양적 우위에도 불구하고 구글 검색 결과의 86%는 여전히 인간 콘텐츠입니다. 이 역설이 우리에게 말해주는 것은 무엇일까요?

ChatGPT 출시 이후 AI 생성 기사의 급격한 증가 추이 (출처: Graphite)

핵심 포인트:

  • ChatGPT 출시 12개월 만에 39%, 24개월 만에 50% 돌파: 2022년 11월 ChatGPT 출시 이후 AI 생성 기사가 폭발적으로 증가하여 2024년 11월 인간 작성 기사를 처음으로 추월. 하지만 2024년 5월 이후 성장은 정체 상태
  • 구글은 여전히 인간을 선호한다: 구글 검색 결과의 86%는 인간 콘텐츠, AI 생성 콘텐츠는 14%에 불과. ChatGPT와 Perplexity가 인용하는 기사도 82%가 인간 작성
  • 품질은 같은데 SEO는 다르다: MIT 연구에 따르면 AI 콘텐츠 품질은 인간과 동등하거나 더 우수하지만, 검색 순위는 낮게 나타나 콘텐츠 제작자들이 전략을 재고하기 시작

숫자로 본 전환점

SEO 전문 기업 Graphite가 발표한 연구는 웹 콘텐츠 생태계의 극적인 변화를 보여줍니다. 연구팀은 CommonCrawl 데이터베이스에서 2020년 1월부터 2025년 5월까지 발행된 영문 기사 65,000개를 무작위로 추출했습니다. 100단어 이상의 기사와 리스티클만을 대상으로 했고, Surfer의 AI 탐지 도구를 사용해 분석했습니다.

결과는 놀라웠습니다. ChatGPT가 출시되기 전인 2022년 11월 이전에는 AI 생성 기사가 거의 0%에 가까웠습니다. 그런데 출시 12개월 만인 2023년 11월, AI 생성 기사는 전체의 39%를 차지했습니다. 그리고 2024년 11월에는 마침내 50%를 돌파하면서 역사적인 전환점을 맞이했죠.

Graphite 연구팀은 탐지 도구의 정확도도 철저히 검증했습니다. ChatGPT 출시 이전의 기사 15,894개를 인간 작성으로 가정하고 테스트한 결과, 오탐률(거짓양성)은 4.2%에 불과했습니다. GPT-4o로 직접 생성한 6,009개 기사를 테스트했을 때는 99.4%를 정확히 AI 생성으로 식별했습니다. 이는 연구 결과의 신뢰성을 뒷받침하는 중요한 데이터입니다.

더 흥미로운 건 연구팀이 원본 데이터를 구글 시트로 공개했다는 점입니다. 이러한 투명성은 연구 결과에 대한 신뢰를 한층 높여줍니다.

품질의 역설

여기서 질문이 생깁니다. AI가 만든 콘텐츠가 정말 형편없어서 검색 순위가 낮은 걸까요?

MIT Sloan 경영대학원의 연구는 그 반대를 보여줍니다. 연구팀은 전문 콘텐츠 제작자들에게 마케팅 카피와 설득력 있는 캠페인 문구를 작성하게 했습니다. 동시에 GPT-4를 사용해 같은 작업을 수행했죠. 참가자들에게 출처 정보 없이 콘텐츠만 보여줬을 때, 사람들은 오히려 AI가 생성한 콘텐츠를 선호했습니다.

Originality.ai의 여러 연구도 충격적인 사실을 드러냅니다. 인간은 AI 생성 콘텐츠를 약 50% 확률로만 구분할 수 있습니다. GPT-3 콘텐츠를 식별하는 정확도는 49.9%였고, 심지어 20년 경력의 의료 전문가들도 AI가 작성한 레지던시 지원서를 65.9% 확률로만 구분했습니다. 교사들은 AI 생성 에세이를 37.8~45.1%의 확률로만 정확히 식별했죠.

그렇다면 왜 검색 결과에서는 이렇게 큰 차이가 날까요?

구글의 2025년 검색 품질 평가 가이드라인은 답의 일부를 제공합니다. “페이지의 주요 콘텐츠 전체 또는 대부분이 AI로 생성되었고, 독창성이 거의 또는 전혀 추가되지 않았다면, 평가자는 최하위 등급을 적용해야 한다”고 명시하고 있습니다.

Originality.ai의 지속적인 연구에 따르면, 2025년 9월 현재 구글 검색 결과 상위 20개 중 17.31%가 AI 생성 콘텐츠입니다. 이는 2025년 7월의 19.56%에서 소폭 하락한 수치입니다. 특히 2024년 3월 구글의 알고리즘 업데이트 이후, 수동 조치를 받은 웹사이트의 100%가 AI 콘텐츠를 사용했고, 그중 절반은 게시물의 90~100%가 AI로 생성된 것으로 나타났습니다.

성장의 갑작스러운 정체

더 주목할 만한 사실은 AI 콘텐츠의 성장이 2024년 5월 이후 멈췄다는 점입니다. 폭발적으로 증가하던 AI 생성 기사의 비율이 50%대에서 정체되었습니다.

Graphite 연구팀은 이를 콘텐츠 제작자들이 AI 콘텐츠의 검색 성과가 저조하다는 사실을 깨달았기 때문으로 분석합니다. 인간이 작성한 기사와 품질 면에서 차이가 없음에도 불구하고, 검색 알고리즘은 AI 생성 콘텐츠를 낮게 평가하고 있었던 겁니다.

이는 콘텐츠 제작 전략의 중요한 전환점을 의미합니다. 단순히 많은 콘텐츠를 빠르게 생성하는 것만으로는 충분하지 않다는 교훈이죠. 검색 엔진과 사용자 모두 여전히 인간의 관점과 경험을 중요하게 평가한다는 사실이 명확해졌습니다.

하이브리드의 시대

Graphite 연구에서 측정하지 못한 중요한 영역이 있습니다. 바로 “하이브리드 콘텐츠”입니다. AI가 초안을 작성하고 인간이 편집하거나, 반대로 인간이 초안을 작성하고 AI가 다듬는 방식의 콘텐츠죠.

MIT 연구에서 흥미로운 점은 사람들이 콘텐츠 제작 과정을 알게 되었을 때의 반응입니다. 인간이 관여한 콘텐츠에 대한 평가는 올라갔지만, 순수 AI 콘텐츠에 대한 평가는 변하지 않았습니다. 이는 “인간 선호(human favoritism)”는 존재하지만 “알고리즘 혐오(algorithmic aversion)”는 없다는 것을 의미합니다.

MIT의 Yunhao Zhang 박사는 “소비자들은 AI가 생성한 콘텐츠를 그다지 꺼리지 않습니다. 동시에 제작 과정 어딘가에 인간이 관여했다는 사실을 아는 것에서 큰 이점이 있죠”라고 설명합니다.

이는 완전한 자동화가 아니라 인간과 AI의 협업이 미래의 방향이라는 점을 시사합니다. 실제로 Graphite 연구에서 하이브리드 콘텐츠를 포함했다면, AI의 영향력은 훨씬 더 크게 나타났을 겁니다.

진짜 중요한 것

웹을 가득 채우는 것과 실제로 읽히는 것은 완전히 다른 문제입니다. AI는 웹의 절반을 차지했지만, 사람들이 실제로 찾고 읽는 콘텐츠의 86%는 여전히 인간이 만든 것입니다.

이 역설이 우리에게 주는 교훈은 명확합니다. 양적 우위는 질적 성공을 보장하지 않습니다. 콘텐츠의 가치는 얼마나 빨리, 얼마나 많이 만드느냐가 아니라, 독자에게 얼마나 유용하고 신뢰할 수 있느냐에 달려 있습니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다