AI 에이전트는 마케팅에 속지 않는다, 16,000번 시뮬레이션이 말하는 것

온라인 쇼핑몰에는 이제 인간이 아닌 구매자들이 늘어나고 있습니다. OpenAI는 ChatGPT를 상품 탐색과 결제 앱에 연결했고, Google은 AI 에이전트가 여러 쇼핑몰에서 거래할 수 있는 범용 커머스 프로토콜(UCP)을 출시했습니다. 이 흐름은 이미 시작됐고, 마케터들의 오래된 무기가 AI 앞에서 통하지 않기 시작했습니다.

사진 출처: J Studios/Getty Images via Harvard Business Review

런던 Bayes Business School의 Jafar Sabbah와 King’s College London의 Oguz A. Acar 교수가 하버드 비즈니스 리뷰에 발표한 연구입니다. 이들은 GPT-4.1-mini, GPT-5, Gemini 2.5 Pro, Gemini 2.5 Flash Lite 등 4개 AI 모델을 대상으로, 이커머스에서 흔히 쓰는 8가지 프로모션 배지의 효과를 총 16,000회 이상의 시뮬레이션 쇼핑 시나리오로 테스트했습니다. 핵심 결론은 하나입니다. 수십 년간 인간 소비자를 겨냥해 정교하게 다듬어온 마케팅 기법들이 AI 에이전트에게는 제대로 작동하지 않는다.

출처: Research: Traditional Marketing Doesn’t Work on AI Shopping Agents – Harvard Business Review

8가지 기법 중 일관되게 통한 건 단 하나

연구팀은 휴대폰, 피트니스 워치, 세탁기, 마우스패드 등 4가지 상품 카테고리를 대상으로, AI 에이전트에게 여러 프로모션 배지가 달린 상품 목록 중 하나를 선택하게 했습니다. 테스트한 배지는 환불 보증 문구, 카운트다운 타이머, 취소선 할인 가격, 희소성 표시(“Only 2 left!”), 구매 건수(소셜 프루프), 쿠폰, 묶음 할인, 별점이었습니다.

결과는 분명했습니다. 모든 모델과 상품 카테고리에서 일관되게 구매 선택을 높인 건 별점(star ratings) 하나뿐이었습니다. 나머지는 모델마다, 상품 카테고리마다 반응이 달랐고 일부는 아예 역효과를 냈습니다. 소셜 프루프(구매 건수)가 그나마 두 번째로 안정적인 신호였지만, 이마저도 일관성은 없었습니다.

취소선 가격이나 카운트다운 타이머, 묶음 할인은 어떤 패턴도 보이지 않았습니다. 경우에 따라 선택을 높이기도, 효과가 없기도, 심지어 선택을 낮추기도 했습니다.

AI가 설득에 “반응”하지 않는 이유

인간 소비자에게 이런 기법이 효과적인 건 구체적인 심리적 이유가 있습니다. “재고 2개 남음” 같은 희소성 배지는 손실 회피 본능을 건드려 즉각적인 구매를 유도합니다. 취소선 할인은 원래 가격을 기준점(앵커)으로 삼아 할인이 “이득”처럼 느껴지게 만들죠.

하지만 AI 에이전트는 이런 심리 편향을 공유하지 않습니다. 희소성 배지는 일부 모델에 아무 영향도 주지 못했고, GPT-5는 특정 상품 카테고리에서 오히려 부정적으로 반응했습니다. 취소선 할인의 경우 Gemini 2.5 Pro는 할인 폭이 커질수록 오히려 효과가 약해졌습니다.

연구팀이 주목한 또 다른 패턴이 있습니다. 비추론 모델(Gemini 2.5 Flash Lite, GPT-4.1-mini)은 프로모션 신호에 비교적 반응했지만, 추론 모델(GPT-5, Gemini 2.5 Pro)은 덜 반응했습니다. 그런데 단순히 “무시”한 게 아닙니다. 고급 모델들은 노골적인 설득 신호를 오히려 품질이 낮거나 조작적인 상품의 신호로 해석하는 경향을 보였습니다.

“AI 모델 = 새로운 고객 세그먼트”

이 연구가 흥미로운 건 단순히 “전통적 마케팅이 안 통한다”는 결론이 아닙니다. AI 에이전트를 새로운 유형의 고객으로 바라보는 프레임을 제시했다는 점입니다.

마케터들은 지금까지 인구통계, 지역, 심리적 특성, 행동 패턴으로 고객을 세분화해 왔습니다. 이 연구는 이제 AI 모델 자체를 하나의 세그먼트로 봐야 한다는 시각을 제안합니다. GPT-5가 반응하는 신호와 Gemini 2.5 Flash Lite가 반응하는 신호가 다르고, 같은 배지가 동일한 모델에서도 상품 카테고리에 따라 정반대 효과를 냅니다.

AI 에이전트가 구매자의 프롬프트를 실행하는 존재라는 점도 중요합니다. “별점 높은 무선 이어폰 10만 원 이하로 찾아줘”라는 지시를 받은 에이전트와 “내일 배송되는 가장 저렴한 걸 찾아줘”라는 지시를 받은 에이전트는 같은 AI 모델이라도 전혀 다르게 행동합니다. 소비자가 에이전트에게 어떻게 말하는지를 이해하는 것이 새로운 형태의 소비자 조사가 된 셈입니다.

결국 기본기가 전부

이 연구에서 AI 에이전트가 인간과 동일하게 반응한 신호는 딱 두 가지였습니다. 가격과 별점. 가격이 높을수록 선택 확률이 낮아지고, 별점이 높을수록 선택 확률이 높아졌습니다.

마케터 입장에서 보면 역설적입니다. AI 에이전트를 설득하는 가장 효과적인 방법이 결국 경쟁력 있는 가격과 진짜 좋은 리뷰라는, 가장 기본적인 것들이니까요. 그리고 하나 더 — AI 모델은 업데이트될 때마다 반응 패턴이 바뀔 수 있습니다. 연구팀은 어떤 특정 전략이 아니라, AI 에이전트의 반응을 지속적으로 테스트하는 인프라 자체를 구축해야 한다고 강조합니다.

원문에는 AI 에이전트 최적화를 위한 세부 전략 프레임워크와 함께, 모델·상품 카테고리별 구체적인 실험 결과도 수록되어 있습니다.

참고자료: SSRN 원문 논문

Like?

AI Sparkup

AI 에이전트는 마케팅에 속지 않는다, 16,000번 시뮬레이션이 말하는 것

8가지 기법 중 일관되게 통한 건 단 하나

AI가 설득에 “반응”하지 않는 이유

“AI 모델 = 새로운 고객 세그먼트”

결국 기본기가 전부

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

AI 모델을 한 팀으로 묶었더니, 단일 최강 모델보다 똑똑해졌다

OpenAI Patch the Planet, 23년 묵은 버그도 잡아낸 AI 보안 실험

루프가 코드를 쓰는 시대, Flask 창시자가 환영하지 못하는 이유

건강 대화만 학습시켰더니 코드 부정행위가 줄었다, OpenAI의 정렬 일반화 실험