AI 기술 분석
RAG 앱 구축을 설정 파일 하나로, NyRAG의 5단계 파이프라인
설정 파일만으로 RAG 앱을 구축하는 NyRAG의 5단계 파이프라인과 기술 아키텍처를 소개합니다. Vespa 기반 하이브리드 검색부터 로컬/클라우드 배포까지.
Written by

대화만 하는 챗봇을 일 처리하는 에이전트로, Tool Calling 설계법
ChatGPT가 웹 검색하고 코드를 실행하는 비밀, Tool Calling. 데이터·계산·행동 3가지 기둥으로 대화형 챗봇을 실제 일 처리하는 에이전트로 만드는 설계 프레임워크를 소개합니다.
Written by

LLM이 컨텍스트 윈도우 100배를 처리한다: MIT의 Recursive Language Models
MIT CSAIL의 Recursive Language Models(RLM)은 LLM이 컨텍스트 윈도우 100배 규모의 입력을 처리하도록 합니다. 프롬프트를 환경 변수로 취급하고 재귀 호출로 1,000만 토큰 이상을 효율적으로 다루는 혁신적 추론 전략입니다.
Written by

텍스트 청킹 164GB/s로 만들기: memchr와 SIMD로 기존 라이브러리 96,000배 빠르게
RAG 파이프라인용 텍스트 청킹을 164GB/s로 처리하는 memchunk. SIMD와 룩업 테이블로 기존 라이브러리보다 최대 96,000배 빠른 속도를 달성한 방법을 소개합니다.
Written by

이미지 100장으로 AI 모델을 망가뜨린다: Nightshade의 ‘독’ 이미지 공격
시카고대 연구팀의 Nightshade는 이미지 100장으로 AI 모델을 망가뜨리는 ‘독’ 이미지 기술입니다. 예술가들의 새로운 저작권 방어 수단을 소개합니다.
Written by

DeepSeek, AI 학습 불안정성을 3000배→1.6배로 잡다: mHC 아키텍처의 비밀
DeepSeek의 mHC 아키텍처가 대규모 AI 모델 학습의 불안정성 문제를 어떻게 해결했는지 소개합니다. 신호 증폭 3000배→1.6배 개선으로 안정성과 성능을 동시에 확보한 비결을 설명합니다.
Written by

AI 에이전트의 3가지 장기 메모리: 경험·지식·스킬을 저장하는 기술
자율 AI 에이전트가 진정한 자율성을 갖추려면 3가지 장기 메모리가 필요합니다. 에피소드·의미론·절차 메모리의 역할과 구현 방법을 기술적으로 설명합니다.
Written by

MLflow로 AI 에이전트 안전성 테스트: GPT vs Gemini 레드팀 실험
MLflow를 활용해 AI 에이전트 안전성을 체계적으로 평가하는 3-모델 레드팀 프레임워크. GPT vs Gemini 실험 결과와 실무 적용 방법을 소개합니다.
Written by

MiniMax M2.1: Python 넘어 Rust·Java까지, 실무 다중언어 코딩 특화 AI 모델
MiniMax M2.1은 Python을 넘어 Rust, Java, Golang 등 실무 다중 언어에 특화된 오픈소스 AI 모델. Claude Sonnet 4.5 능가하는 성능과 실무 활용성을 소개합니다.
Written by

AI가 AI를 평가한다: 16개 모델 안전성 테스트 자동화 도구 Bloom
Anthropic이 AI 모델의 안전성 평가를 자동화하는 오픈소스 도구 Bloom을 공개했습니다. 연구자가 행동만 정의하면 AI가 테스트 시나리오를 생성하고 판단까지 수행합니다.
Written by
