조직 내부 문서로 조사 보고서를 만들려면 검색 품질만큼 데이터 위치와 접근 권한이 중요하다. Onyx는 검색 증강 생성(RAG, Retrieval-Augmented Generation), 웹 검색, 코드 실행, 딥 리서치(Deep Research), 커스텀 에이전트와 MCP(Model Context Protocol) 서버를 제공하는 AI 애플리케이션 플랫폼이다. Community Edition 핵심 기능은 MIT 라이선스로 제공되며, 2026년 5월 26일 기준 GitHub에서 약 2만 9,800개의 스타를 받았다.
무엇이 다른가
| 요구사항 | 단순 챗봇 + 벡터 DB | Onyx |
|---|---|---|
| 사내 지식 연결 | 인제스트·권한 동기화를 직접 구현 | 50개 이상의 인덱싱 커넥터와 MCP 연동 제공 |
| 공개 웹 조사 | 별도 검색 도구 연결 필요 | 웹 검색과 URL 본문 가져오기 제공 |
| 긴 보고서 조사 | 앱에서 루프를 별도로 설계 | 다단계 Deep Research 흐름 제공 |
| 외부 에이전트 연결 | 커스텀 API 래퍼 작성 | Onyx MCP Server가 검색 도구를 HTTP로 노출 |
| 운영 위치 | 설계에 따라 달라짐 | Standard 배포를 자체 인프라에서 실행 가능 |
Onyx의 장점은 “LLM 앞에 문서 검색 하나를 붙이는 것”에 그치지 않고, 지식 동기화와 검색, 조사 실행, 외부 에이전트 접속 지점을 한 플랫폼에서 관리할 수 있다는 점이다. Google Drive, GitHub, Jira, Slack, Confluence, Notion, Salesforce, SharePoint 등 여러 업무 소스를 같은 검색 계층에 넣으려는 팀에 적합하다.
Deep Research와 벤치마크 해석
Onyx는 Deep Research Benchmark 제출 저장소에서 종합 점수 54.92로 공개 리더보드 1위를 기록했다고 보고했다. 같은 표에서 Gemini 2.5 Pro Deep Research는 49.71, OpenAI Deep Research는 46.45, Perplexity Deep Research는 40.46으로 기재돼 있다.
이 결과를 “완전 로컬 모델만으로 상용 서비스보다 낫다”는 의미로 읽으면 안 된다. 제출 결과는 2026년 2월 7일 nightly 빌드에 GPT-5.2, Serper 웹 검색 API, Firecrawl 크롤러를 조합해 생성됐다. 즉, Onyx의 조사 오케스트레이션과 출력 품질을 보여주는 결과이지, 모든 의존성을 자체 호스팅한 구성의 성능 검증은 아니다.
배포 모드
| 모드 | 적합한 경우 | 포함 기능 |
|---|---|---|
| Lite | 인터페이스와 에이전트를 빠르게 시험할 때 | 메모리 1GB 미만으로 실행 가능한 경량 구성 |
| Standard | 사내 문서 검색과 지속적 동기화가 필요할 때 | 벡터 + 키워드 인덱스, 백그라운드 워커, 추론 서버, Redis·MinIO 기반 확장 구성 |
내부 문서를 검색하는 리서치 시스템이라면 Standard가 실질적인 출발점이다. 지식 커넥터가 문서를 동기화하고 인덱스를 유지해야 외부 에이전트가 최신 자료를 같은 방식으로 질의할 수 있다.
MCP로 외부 에이전트에 검색 제공하기
Onyx MCP Server는 MCP 호환 클라이언트에 세 가지 핵심 도구를 제공한다.
| 도구 | 역할 |
|---|---|
search_indexed_documents | Onyx에 인덱싱된 사내 지식에서 관련 청크 검색 |
search_web | 공개 웹 검색 결과와 스니펫 조회 |
open_urls | 선택한 URL의 전체 본문 가져오기 |
자체 호스팅 인스턴스에서는 MCP 서버를 활성화한 뒤, Bearer 토큰과 HTTP 엔드포인트를 MCP 클라이언트에 등록한다.
# Onyx 배포 설정
MCP_SERVER_ENABLED=true{
"mcpServers": {
"onyx": {
"type": "http",
"url": "http://YOUR_ONYX_DOMAIN:8090/",
"headers": {
"Authorization": "Bearer ${ONYX_TOKEN}"
}
}
}
}이 방식이면 Claude Code, Cursor 같은 도구뿐 아니라 CrewAI 에이전트도 Onyx의 동일한 검색 계층을 사용할 수 있다.
빠른 시작
Onyx 공식 설치 스크립트는 Docker Compose 기반의 Lite 또는 Standard 배포를 안내한다.
curl -fsSL https://onyx.app/install_onyx.sh | bash설치 뒤에는 다음 순서로 운영 구성을 잡는 편이 안전하다.
- 내부 문서를 다룬다면 Standard 모드를 선택하고 인증·권한 정책을 먼저 설정한다.
- Google Drive, GitHub, Jira 등 필요한 데이터 소스만 연결하고 검색 결과가 권한 경계를 지키는지 검증한다.
- 웹 검색·크롤러와 사용할 LLM이 외부 서비스인지 자체 호스팅인지 기록한다.
- MCP Server를 활성화하고 리서치 에이전트에는 읽기·검색에 필요한 토큰만 제공한다.
- 최종 보고서의 인용 URL과 검색 로그를 보존해 감사 가능하게 만든다.
언제 쓰면 좋은가
- 사내 문서와 공개 웹을 한 조사 보고서에서 함께 사용해야 하는 지식관리·분석 팀
- 문서가 외부 SaaS 인덱스에 저장되는 것을 제한해야 하는 조직
- 여러 에이전트나 개발 도구가 동일한 검색·권한 계층을 공유해야 하는 플랫폼 팀
- 긴 조사 작업의 검색 경로와 인용을 추적해야 하는 규제·감사 환경
질의와 모델 추론까지 외부 전송을 차단하려면 Onyx만 자체 호스팅하는 것으로는 충분하지 않다. 연결하는 LLM, 웹 검색·크롤링 공급자, 음성 모델의 실행 위치와 라이선스도 별도로 검토해야 한다.
라이선스
Onyx Community Edition의 핵심 Chat, RAG, Agents, Actions 기능은 MIT 라이선스로 공개돼 있다. 저장소의 ee 디렉터리 아래 Enterprise Edition 구성은 별도 Onyx Enterprise License를 따른다.
관련 문서
- onyx-tutorial-self-hosted-deep-research — Onyx, CrewAI, Voxtral을 조합하는 딥 리서치 구축 순서
- rag — 외부 지식을 LLM 응답에 주입하는 검색 증강 생성의 기본 원리
- feynman — 멀티 에이전트 병렬 조사에 초점을 둔 별도 오픈소스 리서치 도구
- multi-agent-research-assistant-tutorial-python — 검색·판단·분석 역할 분리 패턴
참고 자료
- onyx-dot-app/onyx — GitHub 공식 저장소
- Onyx Deep Research Benchmark Results — Onyx 공식 제출 저장소
- Onyx MCP Server — Onyx 공식 문서 (2026-05-26 확인)
- Quickstart — Onyx 공식 문서 (2026-05-26 확인)