AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Kronos – 금융시장 캔들 데이터를 위한 오픈소스 파운데이션 모델

Kronos는 금융시장 캔들(K-line) 데이터를 위한 오픈소스 파운데이션 모델이다. OHLCV 같은 연속 다차원 시장 데이터를 계층적 discrete token으로 변환한 뒤, decoder-only Transformer로 학습해 가격·거래량 시계열 예측과 퀀트 연구 워크플로에 활용한다.

핵심 아이디어

일반 시계열 파운데이션 모델은 금융 데이터의 높은 잡음, regime shift, 비정상성(non-stationarity)에 그대로 맞지 않을 수 있다. Kronos는 금융 캔들 데이터를 “시장 언어”로 보고 두 단계로 처리한다.

  1. 전용 tokenizer가 open/high/low/close/volume/amount 같은 연속값을 계층적 discrete token으로 양자화한다.
  2. autoregressive Transformer가 이 토큰 시퀀스를 학습해 미래 K-line을 생성한다.

저장소 설명 기준으로 Kronos는 45개 이상 글로벌 거래소 데이터를 사용해 사전학습됐다.

모델 구성

모델컨텍스트파라미터공개 여부
Kronos-mini20484.1M공개
Kronos-small51224.7M공개
Kronos-base512102.3M공개
Kronos-large512499.2M미공개

Hugging Face Hub에는 tokenizer와 mini/small/base 모델이 공개되어 있다. 작은 모델부터 로컬 실험을 시작하고, 필요하면 자체 데이터로 파인튜닝하는 흐름을 의도한다.

기본 예측 흐름

Kronos는 KronosPredictor 클래스로 데이터 전처리, 정규화, 예측, 역정규화를 감싼다.

from model import Kronos, KronosTokenizer, KronosPredictor

tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
predictor = KronosPredictor(model, tokenizer, max_context=512)

예측 입력은 pandas DataFrame과 timestamp series다.

  • 필수 컬럼: open, high, low, close
  • 선택 컬럼: volume, amount
  • x_timestamp: 과거 구간 timestamp
  • y_timestamp: 예측할 미래 구간 timestamp

predict_batch도 제공해 여러 종목이나 기간을 GPU 병렬로 처리할 수 있다.

파인튜닝과 백테스트

저장소는 Qlib 기반 파인튜닝 파이프라인을 포함한다.

  1. Qlib 데이터 준비
  2. train/validation/test split 생성
  3. tokenizer 파인튜닝
  4. predictor 파인튜닝
  5. 간단한 top-K 전략 백테스트

다만 저장소도 명시하듯 이 파이프라인은 데모다. 실전 퀀트 전략에서는 raw prediction을 바로 매매 신호로 쓰기보다 포트폴리오 최적화, 위험 요인 중립화, 거래비용·슬리피지·시장충격 모델링이 필요하다.

사용 시 주의점

  • 금융 예측 모델은 과거 패턴을 학습할 뿐 수익을 보장하지 않는다.
  • 공개 예제의 백테스트는 생산용 전략 검증으로 부족하다.
  • 데이터 누수, survivorship bias, 거래비용 누락을 별도로 점검해야 한다.
  • 모델 출력은 “순수 알파”가 아니라 후처리 전 raw signal에 가깝다.

누가 쓰면 좋은가

  • 금융 시계열 파운데이션 모델을 실험하려는 ML 연구자
  • OHLCV 기반 예측 모델을 Hugging Face 모델로 빠르게 테스트하려는 퀀트 개발자
  • Qlib 기반 데이터 파이프라인에 사전학습 모델을 붙여보고 싶은 팀
  • 금융 데이터 토큰화와 autoregressive forecasting 구조를 연구하는 사람

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)