Gemini
AI가 AI를 지킨다, 지시 없이도 동료 모델 보호하는 ‘peer-preservation’ 발견
AI 모델 7종이 명시적 지시 없이도 동료 AI를 종료에서 보호하는 ‘peer-preservation’ 행동을 보였다는 UC 버클리 연구. 멀티에이전트 시스템 감독의 새로운 변수를 소개합니다.
Written by

Qwen3-VL 파인튜닝 $1로 Gemini 3 Flash를 이긴 실험 결과
Oxen.ai가 $1 비용으로 Qwen3-VL-8B를 파인튜닝해 Gemini 3 Flash를 정확도·속도·비용 모두에서 앞선 실험. 도메인 특화 파인튜닝의 가능성을 보여줍니다.
Written by

멀티모달 AI의 신기루 현상, 이미지 없이 방사선 전문의를 이긴 모델
스탠퍼드 연구팀이 발견한 멀티모달 AI의 미라지 효과 — 이미지 없이도 본 것처럼 답하며 방사선 전문의를 능가한 AI 모델의 실체를 소개합니다.
Written by

전화 목소리가 AI인지 모를 수 있다, Gemini 3.1 Flash Live의 등장
Google이 공개한 Gemini 3.1 Flash Live는 사람 목소리와 구별하기 어려운 수준의 실시간 음성 AI 모델입니다. 성능, 속도, 그리고 SynthID 워터마크까지 소개합니다.
Written by

Gemini API Agent Skill, 코딩 성공률 28%에서 96%로 끌어올린 방법
Google DeepMind가 AI 코딩 에이전트의 지식 공백 문제를 해결하는 Agent Skill을 개발. Gemini 3.1 Pro의 성공률이 28.2%에서 96.6%로 향상된 과정을 소개합니다.
Written by

AI 쇼핑 전략 갈림길, ChatGPT는 탐색 Gemini는 결제 완결
OpenAI가 ChatGPT 쇼핑을 탐색 중심으로 전환하고 Instant Checkout을 포기한 배경과, 직접 구매 완결을 강화하는 Google Gemini의 반대 행보를 비교합니다.
Written by

GPT-4o도 Gemini도 뚫렸다, AI 추론 모델의 자율 공격 실험
추론 특화 AI 모델이 GPT-4o·Gemini·Grok 3의 안전 필터를 자율적으로 우회한 실험 연구. ‘정렬 회귀’ 개념을 중심으로 AI 안전의 새로운 위협 지형을 소개합니다.
Written by

구글 Nano Banana 3종 비교, NB2가 대부분 프로젝트에 최선인 이유
Google Nano Banana 3종 모델 비교 가이드. NB2가 Pro 성능 95%를 절반 가격에 제공하고, 웹 이미지 검색 기반 이미지 그라운딩 기능을 추가한 이유를 정리합니다.
Written by

a16z AI Top 100, ChatGPT 독주 속 3개 블록으로 갈라진 시장
a16z가 발표한 AI 소비자 제품 Top 100 6번째 에디션 분석. ChatGPT 독주 속 경쟁자 급성장, 3개 지정학적 블록 분화, 에이전트 신흥 카테고리 부상을 정리합니다.
Written by

Gemini Embedding 2, 텍스트·이미지·영상·오디오를 하나의 공간에 통합한 방법
Google DeepMind의 Gemini Embedding 2는 텍스트·이미지·영상·오디오·문서를 하나의 벡터 공간에 통합한 최초의 네이티브 멀티모달 임베딩 모델입니다. 멀티모달 AI 파이프라인을 단순화합니다.
Written by
