당신이 SEO에 공들인 페이지가 AI 검색 결과에서 보이지 않는다면, 기술적 문제가 아닐 수 있습니다. AI가 당신 페이지의 문장을 선택하는 방식 자체가 달라졌기 때문입니다.

Similarweb의 GEO 전략 담당자와 SEO 리서치 기관 DEJAN이 각각 AI 검색의 핵심 메커니즘을 분석한 글을 발표했습니다. LLM이 사용자 질문을 처리하는 방식, 그리고 콘텐츠가 AI 응답에 실제로 반영되는 비율에 대한 구체적인 데이터가 담겨 있습니다.
출처:
- Keyword Research For GEO: The FAN Methodology Guide – Similarweb
- SRO & Grounding Snippets – DEJAN AI
LLM은 당신의 키워드로 검색하지 않는다
전통 SEO의 핵심 질문은 “어떤 키워드로 순위를 올릴까”였습니다. AI 검색에서는 이 질문 자체가 틀렸습니다.
Similarweb에 따르면, 사용자가 “엔터프라이즈 마케팅팀에 적합한 경쟁 인텔리전스 플랫폼”이라고 입력하면 LLM은 이 질문을 그대로 검색하지 않습니다. 내부적으로 5단계 변환 과정을 거칩니다. ① 사용자 의도를 분류하고, ② 질문을 정제·명확화하고, ③ 6~20개의 서브쿼리로 분해하고, ④ 각 서브쿼리를 병렬로 검색하고, ⑤ 각 서브쿼리별로 검색된 단락 단위 콘텐츠를 종합해 최종 답변을 생성합니다.
“경쟁 인텔리전스 소프트웨어란 무엇인가”, “경쟁 인텔리전스 플랫폼 비교”, “엔터프라이즈 마케팅 분석 도구”처럼, 사용자가 한 번도 타이핑하지 않은 쿼리들이 실제 검색에 쓰입니다. 당신의 콘텐츠가 원래 질문에 최적화되어 있어도, LLM이 만들어낸 서브쿼리들을 커버하지 못하면 응답에 포함되지 않습니다.
더 까다로운 것은 비결정성입니다. 같은 질문에 대해 LLM이 생성하는 서브쿼리의 27%만이 반복적으로 등장하고, 66%는 단 한 번만 나타납니다. 고정된 서브쿼리 목록을 쫓는 것은 움직이는 표적을 노리는 것과 같습니다. Similarweb이 제안하는 대안은 특정 쿼리가 아닌 주제 공간 전체를 의미론적으로 커버하는 콘텐츠 생태계입니다.
AI가 내 페이지에서 실제로 가져가는 것
서브쿼리 커버리지를 확보했다고 해도 다음 장벽이 있습니다. 페이지가 검색 결과에 포함되더라도, 그 내용이 AI 응답에 얼마나 반영되는지는 별개의 문제입니다.
DEJAN은 구글 Gemini의 그라운딩 파이프라인을 역공학으로 분석해 이 과정을 수치화했습니다. 구글은 검색 결과에서 페이지를 가져올 때 문장 단위로 점수를 매겨 쿼리와 관련성 높은 문장만을 추출합니다. 이것이 AI 응답의 실제 원료가 되는 “그라운딩 스니펫”입니다.
7,060개 쿼리, 2,275개 페이지를 분석한 결과, 하나의 쿼리에 할당되는 그라운딩 텍스트는 총 약 2,000단어로 고정되어 있었습니다. 이 예산은 검색 순위에 따라 배분됩니다.
| 순위 | 배분 단어 수 | 비율 |
|---|---|---|
| 1위 | 531단어 | 28% |
| 2위 | 433단어 | 23% |
| 3위 | 378단어 | 20% |
| 4위 | 330단어 | 17% |
| 5위 | 266단어 | 13% |
1위가 5위보다 2배의 그라운딩 지분을 가져갑니다. 그리고 한 페이지에서 실제로 추출되는 콘텐츠는 평균 전체의 32%에 불과합니다. 페이지가 2,000단어를 넘어가면 추출량은 약 540단어 수준에서 더 이상 늘지 않습니다. 콘텐츠가 많아도 AI가 가져가는 양은 정체되는 것입니다.
추출되는 내용도 선별적입니다. 핵심 가치 제안, 구체적 기능 설명, 가격·스펙 같은 명확한 정보는 선택되지만, 내비게이션 요소, 홍보성 문구, 법적 고지 등은 거의 걸러집니다. 도입부 단락은 내용과 무관하게 거의 통째로 추출되는 경향도 관찰됐습니다.
SEO 다음의 지표, SR
DEJAN은 이 맥락에서 SRO(Selection Rate Optimization), 즉 선택률 최적화라는 새로운 개념을 제안합니다. 전통 SEO에서 클릭률(CTR)이 핵심 지표였다면, AI 검색에서는 “검색된 소스 중 AI가 실제로 선택한 비율”인 선택률(SR)이 그 자리를 대신합니다. 1위로 순위에 올라도 그라운딩 단계에서 선택받지 못하면 응답에 등장하지 않습니다.
선택률에 가장 큰 영향을 미치는 것은 AI 모델이 해당 브랜드나 도메인을 특정 주제와 얼마나 강하게 연결 짓는지, 즉 모델의 “사전 인식”입니다. 이 인식은 파인튜닝 데이터에 의해 형성되며, 전통적인 온페이지·오프페이지 SEO 작업이 간접적으로 영향을 줄 수 있습니다. 다만 반영되기까지 3~6개월의 시간이 걸립니다.
두 글이 함께 가리키는 방향은 분명합니다. AI 검색에서의 가시성은 하나의 키워드에 최적화된 한 페이지로 결정되지 않습니다. 어떤 서브쿼리가 생성되더라도 커버할 수 있는 콘텐츠 생태계, 그리고 짧고 밀도 높은 문장으로 그라운딩 추출에서 살아남는 구조가 필요합니다. 각 플랫폼별 구현 차이, 팬아웃 커버리지 감사 방법, 콘텐츠 브리프 템플릿은 원문에서 상세히 다루고 있습니다.
참고자료:
- Query Fan-out이란 무엇인가 – Similarweb
- AI Brand Visibility Report 2026 – Similarweb

답글 남기기