생성형 AI가 만들어낸 콘텐츠와 사람이 만든 콘텐츠를 구별하기 어려워지면서 투명성 문제가 부각됐다. Google DeepMind는 이 문제를 해결하기 위해 SynthID를 출시했다. AI가 생성한 이미지·오디오·텍스트·영상에 사람 눈에 보이지 않는 디지털 워터마크를 삽입해 출처를 식별하는 도구다. 2026년 4월에는 보안 연구자들의 역공학 연구로 기술의 구조적 한계도 드러났다.
지원 콘텐츠 유형
SynthID는 AI가 생성하는 네 가지 콘텐츠 유형 모두에 워터마크를 삽입한다.
| 유형 | 방식 | 적용 제품 |
|---|---|---|
| 이미지·영상 | 픽셀에 보이지 않는 패턴 삽입. 크롭·필터·프레임레이트 변경·손실 압축에도 유지 | Google AI 이미지 생성 |
| 오디오 | 오디오 신호에 감지 불가 워터마크 삽입. 노이즈 추가·MP3 압축·재생속도 변경에도 유지 | Lyria (AI 음악 생성), NotebookLM 팟캐스트 |
| 텍스트 | 토큰 생성 시 확률 점수를 미세 조정해 워터마크 패턴 형성. 출력 품질에 영향 없음 | Gemini 앱 및 웹 |
| 영상 세그먼트 | 이미지와 동일한 방식으로 영상 프레임에 적용 | Google AI 영상 생성 |
SynthID 동작 방식
SynthID는 대부분의 기존 워터마킹 기술과 다른 접근법을 사용한다. 주파수 공간이나 반복 패턴 대신 두 개의 딥러닝 모델을 활용한다.
- 인코더(Encoder): 생성된 이미지에 감지할 수 없는 패턴을 삽입하도록 훈련된 모델
- 디코더(Decoder): 패턴을 탐지하도록 훈련된 모델. 확률적(probabilistic) 방식으로 워터마크의 존재 비율을 판단
결과적으로 워터마크는 이미지 전체 픽셀에 분산되며, 히스토그램 평활화(histogram equalization) 같은 이미지 분석 기법으로 패턴의 흔적을 시각화할 수 있다.
텍스트의 경우, LLM이 토큰을 생성할 때 각 단어에 확률 점수를 부여한다. “My favourite tropical fruits are mango and…” 다음에 “bananas”는 높은 점수, “airplanes”는 낮은 점수를 받는다. SynthID는 이 확률 점수를 미세 조정해 워터마크 패턴을 형성한다.
Gemini를 통한 탐지
Gemini에 이미지·영상·오디오 파일을 업로드하고 “Google AI가 생성하거나 수정한 콘텐츠인지” 물으면 SynthID 워터마크를 확인해준다. 탐지 결과는 “Yes”, “Some”, “Not detected” 세 단계로 반환된다.
SynthID Detector
Google은 언론인·미디어 전문가를 대상으로 SynthID Detector 검증 포털을 운영 중이다. 이미지·영상·오디오·텍스트를 업로드하면 SynthID 워터마크 여부를 확인할 수 있다. 현재 얼리 테스터 대기자 명단을 모집하고 있다.
주요 한계와 문제점
1. 일관성 없는 탐지 성능
Gemini 탐지기는 저디테일(단색·흑백) 영역의 워터마크를 놓치는 경향이 있다. 인코더는 이미지 전체에 워터마크를 삽입하지만, 디코더는 세부 컨텐츠가 있는 영역에서만 신뢰할 수 있는 탐지를 수행한다.
2. 할루시네이션 위험
연구 과정에서 Gemini가 URL 분석 능력을 갖추고 있다고 주장하다가 나중에 “실제로 URL에 접근하지 않았다”고 번복하는 현상이 발견됐다. AI 시스템이 워터마크 삽입(인코딩)과 탐지(디코딩) 모두를 담당하는 구조에서, 프론트엔드 AI의 할루시네이션이 결과 해석을 오염시킬 수 있다.
3. 프로프리어터리 구조의 역설
SynthID 탐지는 Google에 미디어를 제출해야만 가능해, 기밀 콘텐츠(법적 증거, 의료 기록, 정부 기밀)에는 사용하기 어렵다. 알고리즘이 비공개이므로 성능 지표도 외부 검증이 불가능하다.
4. 메타데이터와의 불일치
Google AI가 생성한 이미지에는 Edited with Google AI 메타데이터가 포함되지만, 메타데이터는 쉽게 제거하거나 변조할 수 있어 단독으로는 신뢰하기 어렵다.
역공학: SynthID 없이 SynthID 탐지하기
2026년 4월, 연구자 Alosh Denny가 Google 없이 SynthID를 탐지하는 개념 증명 코드를 공개했다. Dr. Krawetz의 자체 분석과 결합된 이 연구는 다음을 밝혀냈다.
- SynthID 인코더가 이미지에 적용하는 변환 패턴 구조
- 디코더의 임계값과 탐지 신뢰도 특성
- 워터마크가 이미지 스케일링·크롭·재색상화에 얼마나 강건한지
역공학의 시사점
역공학 가능성은 곧 위조 가능성을 의미한다. SynthID가 단독으로 미디어 출처 확인의 신뢰 기반이 될 수 없음을 시사하며, 보완적인 탐지 체계가 필요하다.
AI 워터마킹의 더 넓은 맥락
Adobe(TrustMark), Meta(AudioSeal / Stable Signature), Microsoft(InvisMark) 등 주요 기업이 모두 유사한 보이지 않는 워터마킹 기술을 개발 중이다. 공통적인 구조적 딜레마는 다음과 같다.
| 딜레마 | 설명 |
|---|---|
| 공개 vs 보안 | 알고리즘을 공개하면 워터마크를 쉽게 제거할 수 있고, 비공개면 검증이 불가능 |
| 제출 vs 기밀성 | 탐지를 위해 미디어를 벤더에 제출하면 기밀 콘텐츠에 사용 불가 |
| 단일 워터마크 가정 | 파일에 여러 워터마크가 공존할 수 있어 하나를 찾아도 전부 찾은 게 아님 |
| AI 해석의 신뢰성 | 탐지 결과를 프론트엔드 AI가 해석하면 할루시네이션이 개입할 수 있음 |
사용 대상 및 케이스
- 디지털 포렌식 전문가: AI 생성 이미지 감별이 필요한 조사 업무에서 SynthID의 신뢰 범위를 정확히 파악하고 보완 도구 병용
- 미디어 및 콘텐츠 팀: AI 생성 이미지 사용 여부를 확인하는 워크플로에 메타데이터 분석과 SynthID를 조합
- AI 안전 연구자: 콘텐츠 출처 확인 기술의 한계와 개선 방향 연구
라이선스
SynthID 자체는 Google의 독점 기술. 역공학 코드(aloshdenny/reverse-SynthID)는 개념 증명 목적의 오픈소스.
참고 자료
- SynthID – A tool to watermark and identify content generated through AI — Google DeepMind 공식 페이지
- Reversing SynthID — Hacker Factor Blog (2026-04-16)