벡터검색
AI 에이전트 메모리 설계, Claude Code와 Zep은 어떻게 다른가
AI 에이전트 메모리 시스템의 저장·검색·주입·생성 4단계를 Zep, Letta, Claude Code와 비교 분석. 긴 컨텍스트 창이 메모리를 대체할 수 없는 이유와 각 구현 방식의 트레이드오프를 소개합니다.
Written by

클래식 RAG의 실패 지점, 에이전틱 RAG가 다른 이유
클래식 RAG의 단방향 파이프라인이 왜 조용히 실패하는지, 에이전틱 RAG의 루프 구조가 어떻게 다른지를 비교 분석합니다.
Written by

Gemini Embedding 2, 텍스트·이미지·영상·오디오를 하나의 공간에 통합한 방법
Google DeepMind의 Gemini Embedding 2는 텍스트·이미지·영상·오디오·문서를 하나의 벡터 공간에 통합한 최초의 네이티브 멀티모달 임베딩 모델입니다. 멀티모달 AI 파이프라인을 단순화합니다.
Written by

Obsidian 노트에 AI 검색을 붙인다면? DuckDB로 만드는 개인 지식 어시스턴트
Obsidian 노트 8천 개에 AI 검색을 붙인 사례. DuckDB를 벡터 DB로 활용해 의미 기반 검색과 숨겨진 연결을 찾는 방법을 소개합니다.
Written by

RAG 앱 구축을 설정 파일 하나로, NyRAG의 5단계 파이프라인
설정 파일만으로 RAG 앱을 구축하는 NyRAG의 5단계 파이프라인과 기술 아키텍처를 소개합니다. Vespa 기반 하이브리드 검색부터 로컬/클라우드 배포까지.
Written by

LEAF: 23M 파라미터로 OpenAI 임베딩 성능 97% 달성, CPU만으로 작동
MongoDB가 공개한 LEAF 프레임워크는 대형 임베딩 모델을 5~15배 압축하면서도 성능 97%를 유지합니다. GPU 없이 CPU만으로 고성능 RAG 구현이 가능해졌습니다.
Written by

벡터 검색이 복잡한 쿼리에 실패하는 이유: Superlinked가 제시하는 메타데이터 통합 전략
텍스트 임베딩만으론 부족합니다. Superlinked는 숫자, 카테고리, 시간 데이터를 벡터와 함께 인코딩해 복잡한 검색 쿼리를 처리하는 오픈소스 프레임워크입니다.
Written by

구글 Gemini API의 File Search: 저장소는 공짜, RAG 구축은 한 줄
구글 Gemini API의 File Search Tool로 RAG 시스템 구축이 API 한 줄로 단순화됐습니다. 저장소와 쿼리는 무료, 개발자 경험의 혁신을 소개합니다.
Written by

AI 검색의 새 기준: Mixedbread Search가 LLM 호출 16% 줄이고 정확도 16% 높인 비결
Mixedbread Search 베타 출시. 텍스트, 이미지, 오디오, 비디오를 단일 API로 검색하며 기존 시맨틱 검색 대비 LLM 호출 16% 감소, 정확도 16% 향상을 달성한 차세대 검색 솔루션을 소개합니다.
Written by

