Open Knowledge Format(OKF)은 Google Cloud가 공개한 개방형 지식 번들 형식이다. Markdown 파일과 YAML frontmatter만으로 데이터셋, 테이블, 메트릭, 런북, API 같은 개념 지식을 표현해 사람이 읽고 AI 에이전트가 파싱할 수 있게 한다.
문제: 컨텍스트가 흩어져 있다
AI 에이전트가 조직 내부 데이터를 다루려면 모델 자체 지식보다 조직 맥락이 중요하다. 예를 들어 “weekly active users를 어떻게 계산하나”라는 질문에는 테이블 스키마, 메트릭 정의, join 경로, 예외 규칙, 과거 의사결정이 필요하다.
하지만 이 지식은 보통 여러 곳에 흩어져 있다.
- 데이터 카탈로그
- 사내 위키
- 코드 주석과 노트북
- 운영 런북
- 일부 시니어 엔지니어의 머릿속
OKF는 이 지식을 또 다른 서비스에 가두는 대신, 파일 기반 포맷으로 교환 가능하게 만드는 접근이다.
형식
OKF v0.1의 기본 단위는 concept 문서다. 하나의 개념은 하나의 Markdown 파일이고, 파일 경로가 identity가 된다.
sales/
├── index.md
├── datasets/
│ └── orders_db.md
├── tables/
│ ├── orders.md
│ └── customers.md
└── metrics/
└── weekly_active_users.md각 문서는 YAML frontmatter와 Markdown 본문으로 구성된다.
type: BigQuery Table
title: Orders
description: One row per completed customer order.
resource: https://console.cloud.google.com/bigquery?p=acme&d=sales&t=orders
tags: [sales, revenue]
timestamp: 2026-05-28T14:30:00Z본문에는 스키마, join, 예시 쿼리, 운영 메모, 출처를 자유롭게 작성한다. 문서 간 관계는 일반 Markdown 링크로 표현한다.
설계 원칙
| 원칙 | 의미 |
|---|---|
| 최소 의견 | 필수 필드는 작게 유지하고 조직별 content model을 강제하지 않는다 |
| 생산자/소비자 분리 | 사람이 쓴 번들, LLM이 만든 번들, 카탈로그 export를 모두 같은 방식으로 소비할 수 있다 |
| 포맷이지 플랫폼 아님 | 특정 클라우드, SDK, 데이터베이스, 모델 제공자에 묶이지 않는다 |
이 설계는 llm-knowledge-base나 Karpathy식 LLM wiki 패턴과 닮았다. 차이는 개인·팀별 관습을 넘어서, 서로 다른 도구가 교환할 수 있는 최소 계약을 정했다는 점이다.
Google Cloud 구현
Google Cloud는 OKF와 함께 reference producer/consumer를 공개했다.
- BigQuery dataset을 순회해 테이블·뷰별 OKF 문서를 만드는 enrichment agent
- OKF bundle을 단일 HTML 그래프 뷰로 보여주는 static visualizer
- GA4 e-commerce, Stack Overflow, Bitcoin public dataset 샘플 번들
- knowledge-catalog에서 OKF ingest 지원
즉 OKF는 Google Cloud Knowledge Catalog의 보조 포맷이면서, 동시에 독립적으로 사용할 수 있는 개방형 지식 교환 형식이다.
누가 쓰면 좋은가
- 데이터 카탈로그와 사내 위키를 AI 에이전트가 읽을 수 있는 형식으로 정리하려는 데이터 플랫폼 팀
- RAG보다 지속적으로 갱신되는 Markdown 지식 베이스를 운영하려는 에이전트 개발자
- 특정 벤더의 카탈로그나 지식 그래프에 지식을 잠그고 싶지 않은 조직
- 코드 저장소 옆에 메타데이터와 운영 지식을 version control하고 싶은 팀
관련 문서
- knowledge-catalog — Google Cloud의 지식 그래프 기반 데이터 카탈로그
- llm-knowledge-base — LLM이 유지하는 Markdown 위키 기반 지식 베이스
- llm-wikid — raw 소스에서 위키를 컴파일하는 인제스트 패턴
참고 자료
- How the Open Knowledge Format can improve data sharing — Google Cloud Blog (2026-06-12)
- GoogleCloudPlatform/knowledge-catalog OKF — GitHub 공식 저장소