흩어진 문서를 AI가 읽는 지식으로, Google OKF의 설계 원칙

2026-06-17

﹒

2 minutes

AI 에이전트에게 “주간 활성 사용자를 어떻게 집계하나요?”라고 물어보면, 에이전트는 정답을 바로 내놓지 못합니다. 메트릭 정의는 위키에, 테이블 스키마는 데이터 카탈로그에, join 경로는 시니어 엔지니어 머릿속에 — 지식이 사방에 흩어져 있기 때문입니다.

사진 출처: Google Cloud Blog

Google Cloud가 이 파편화 문제를 포맷 하나로 해결하려 나섰습니다. OKF(Open Knowledge Format) v0.1을 공개했는데, 조직의 지식을 Markdown 파일로 표준화해 AI 에이전트와 사람이 함께 읽고 쓸 수 있도록 만든 오픈 스펙입니다. 새로운 플랫폼이나 SDK가 아닌, 파일 형식에 대한 합의입니다.

출처: How the Open Knowledge Format can improve data sharing – Google Cloud Blog

모두가 같은 문제를 각자 풀고 있었다

AI 에이전트가 실제로 일을 잘 하려면 모델 외부의 지식이 필요합니다. 테이블이 어떻게 구성되어 있는지, 메트릭이 어떻게 정의되는지, 특정 API가 언제 deprecated됐는지. 그 지식은 메타데이터 카탈로그, 위키, 코드 주석, 드라이브 폴더, 그리고 시니어 엔지니어의 머릿속에 나뉘어 있습니다.

결과적으로 에이전트를 만드는 팀마다 같은 문제를 처음부터 풀어왔습니다. Obsidian Vault를 코딩 에이전트에 연결하거나, AGENTS.md·CLAUDE.md 같은 컨벤션 파일을 만들거나, 마크다운 파일 폴더를 에이전트가 참고하도록 구성하는 식으로요. 형태는 비슷하지만 서로 연동되지 않는 수백 개의 버전이 만들어졌습니다. 지식은 그것을 만든 팀 안에 갇혀 있었습니다.

AI 연구자 Andrej Karpathy가 “LLM Wiki” 개념을 소개하며 이 패턴을 정리했을 때, Google Cloud는 그것을 상호운용 가능한 표준으로 격상시키기로 했습니다.

OKF가 정한 것, 정하지 않은 것

OKF의 구조는 단순합니다. 하나의 번들은 Markdown 파일들의 디렉터리이고, 각 파일이 하나의 ‘개념(concept)’을 나타냅니다. 테이블, 메트릭, API, 런북 등 무엇이든 될 수 있습니다. 파일 상단에는 YAML frontmatter가 붙고, 나머지는 자유로운 Markdown 본문입니다.

필수 필드는 딱 하나입니다. type. 어떤 타입이 존재하는지, 추가 필드를 어떻게 구성할지는 전적으로 작성자에게 맡깁니다. 개념들은 일반 Markdown 링크로 서로 연결되어 관계 그래프를 형성합니다.

Google Cloud는 세 가지 설계 원칙을 명시했습니다.

최소한의 의견 강요: 스펙은 상호운용에 필요한 최소한만 정합니다. 내용 모델은 작성자가 결정합니다.
생산자/소비자 분리: 사람이 손으로 쓴 번들을 AI 에이전트가 읽을 수 있고, 파이프라인이 자동 생성한 번들을 사람이 뷰어로 볼 수 있습니다. 양쪽 끝의 도구는 독립적으로 교체 가능합니다.
플랫폼 독립: 특정 클라우드, 데이터베이스, 에이전트 프레임워크에 묶이지 않습니다. SDK 없이도 읽고 쓸 수 있습니다.

번들은 어떤 에디터에서도 열리고, GitHub에서도 렌더링되며, 파일 시스템 어디에든 올려둘 수 있습니다.

포맷이 왜 플랫폼보다 나은가

Google Cloud는 레퍼런스 구현도 함께 공개했습니다. BigQuery 데이터셋을 순회하며 각 테이블에 OKF 문서를 자동 생성하는 에이전트, 번들을 인터랙티브 그래프로 시각화하는 HTML 뷰어, GA4·스택오버플로·비트코인 공공 데이터셋으로 만든 샘플 번들 세 가지입니다. Google Cloud의 Knowledge Catalog도 OKF 수집을 지원하도록 업데이트됐습니다.

이 시도에서 주목할 부분은 무엇을 만들지 않았는가입니다. 새로운 서비스도, 계정도, 독점 런타임도 없습니다. 지식 포맷의 가치는 얼마나 많은 팀이 이 형식으로 말하느냐에서 나온다는 판단 때문입니다. 스펙을 오픈으로 공개하고, 생태계가 자라길 기대하는 구조입니다.

OKF v0.1은 완성된 표준이 아닌 출발점이라고 Google은 명시합니다. 실제로 에이전트가 어떤 지식 표현을 필요로 하는지 집단적으로 학습하며 발전시킨다는 계획입니다. 스펙 전문과 레퍼런스 구현, 샘플 번들은 GitHub에 공개되어 있습니다.

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

흩어진 문서를 AI가 읽는 지식으로, Google OKF의 설계 원칙

모두가 같은 문제를 각자 풀고 있었다

OKF가 정한 것, 정하지 않은 것

포맷이 왜 플랫폼보다 나은가

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

AI가 짠 코드, “작동한다”는 이제 완료의 20%일 뿐이다

벡터DB 없이 numpy 한 줄로 백만 건 검색한 결과

일주일 문자만 나눴는데, AI가 사람보다 신뢰를 더 얻었다

에이전트 하네스 논쟁, 덜어낼수록 좋아지는 이유