Gemini 3.1 Flash TTS, 영화 감독처럼 AI 목소리를 연출한다
Google이 발표한 Gemini 3.1 Flash TTS는 수치 파라미터 대신 자연어로 AI 목소리를 연출하는 새로운 TTS 모델입니다. 오디오 태그와 씬 디렉션의 작동 방식을 소개합니다.
Written by

Gemma 4, 로컬 에이전틱 코딩의 문턱을 넘다, 실험 결과로 확인
Gemma 4가 에이전틱 tool calling 벤치마크 6.6%→86.4%를 달성하며 로컬 에이전틱 코딩이 실용 단계에 진입했습니다. M4 맥북 실험 결과를 소개합니다.
Written by

Gemini in Chrome, 자주 쓰는 AI 프롬프트를 원클릭으로 저장하는 Skills 출시
Google이 Chrome에 출시한 Skills 기능 소개. 자주 쓰는 AI 프롬프트를 저장하고 원클릭으로 재실행하는 개인 워크플로 도구입니다.
Written by

구글 Web Guide, AI 검색에서 클릭이 돌아온다
구글이 실험 중인 Web Guide는 AI 검색 중 유일하게 모든 결과가 클릭 가능한 링크. Query Fan-out 작동 원리와 SEO 의미를 정리했습니다.
Written by

전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장
Google이 공개한 Gemini 3.1 Flash Live는 사람 목소리와 구별하기 어려운 수준의 실시간 음성 AI 모델입니다. 성능, 속도, 그리고 SynthID 워터마크까지 소개합니다.
Written by

Gemini API Agent Skill, 코딩 성공률 28%에서 96%로 끌어올린 방법
Google DeepMind가 AI 코딩 에이전트의 지식 공백 문제를 해결하는 Agent Skill을 개발. Gemini 3.1 Pro의 성공률이 28.2%에서 96.6%로 향상된 과정을 소개합니다.
Written by

Google Lyria 3 Pro 출시, AI 음악 생성 30초에서 3분 완성곡으로
Google이 Lyria 3 Pro를 출시했습니다. 30초 클립 한계를 넘어 3분 완성곡 생성, 구글 생태계 전면 통합, SynthID 워터마크 탑재까지 AI 음악의 새로운 기준을 제시합니다.
Written by

AI 쇼핑 전략 갈림길, ChatGPT는 탐색 Gemini는 결제 완결
OpenAI가 ChatGPT 쇼핑을 탐색 중심으로 전환하고 Instant Checkout을 포기한 배경과, 직접 구매 완결을 강화하는 Google Gemini의 반대 행보를 비교합니다.
Written by

Stitch로 구현한 Vibe Design, 텍스트 한 줄로 UI 만드는 Google의 디자인 에이전트
Google Labs가 Stitch를 AI 네이티브 디자인 캔버스로 전환. 텍스트·음성만으로 UI 생성·프로토타이핑까지 가능한 Vibe Design 방식을 소개합니다.
Written by

Gemini Embedding 2, 텍스트·이미지·영상·오디오를 하나의 공간에 통합한 방법
Google DeepMind의 Gemini Embedding 2는 텍스트·이미지·영상·오디오·문서를 하나의 벡터 공간에 통합한 최초의 네이티브 멀티모달 임베딩 모델입니다. 멀티모달 AI 파이프라인을 단순화합니다.
Written by
