Kronos는 금융시장 캔들(K-line) 데이터를 위한 오픈소스 파운데이션 모델이다. OHLCV 같은 연속 다차원 시장 데이터를 계층적 discrete token으로 변환한 뒤, decoder-only Transformer로 학습해 가격·거래량 시계열 예측과 퀀트 연구 워크플로에 활용한다.
핵심 아이디어
일반 시계열 파운데이션 모델은 금융 데이터의 높은 잡음, regime shift, 비정상성(non-stationarity)에 그대로 맞지 않을 수 있다. Kronos는 금융 캔들 데이터를 “시장 언어”로 보고 두 단계로 처리한다.
- 전용 tokenizer가 open/high/low/close/volume/amount 같은 연속값을 계층적 discrete token으로 양자화한다.
- autoregressive Transformer가 이 토큰 시퀀스를 학습해 미래 K-line을 생성한다.
저장소 설명 기준으로 Kronos는 45개 이상 글로벌 거래소 데이터를 사용해 사전학습됐다.
모델 구성
| 모델 | 컨텍스트 | 파라미터 | 공개 여부 |
|---|---|---|---|
| Kronos-mini | 2048 | 4.1M | 공개 |
| Kronos-small | 512 | 24.7M | 공개 |
| Kronos-base | 512 | 102.3M | 공개 |
| Kronos-large | 512 | 499.2M | 미공개 |
Hugging Face Hub에는 tokenizer와 mini/small/base 모델이 공개되어 있다. 작은 모델부터 로컬 실험을 시작하고, 필요하면 자체 데이터로 파인튜닝하는 흐름을 의도한다.
기본 예측 흐름
Kronos는 KronosPredictor 클래스로 데이터 전처리, 정규화, 예측, 역정규화를 감싼다.
from model import Kronos, KronosTokenizer, KronosPredictor
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
predictor = KronosPredictor(model, tokenizer, max_context=512)예측 입력은 pandas DataFrame과 timestamp series다.
- 필수 컬럼:
open,high,low,close - 선택 컬럼:
volume,amount x_timestamp: 과거 구간 timestampy_timestamp: 예측할 미래 구간 timestamp
predict_batch도 제공해 여러 종목이나 기간을 GPU 병렬로 처리할 수 있다.
파인튜닝과 백테스트
저장소는 Qlib 기반 파인튜닝 파이프라인을 포함한다.
- Qlib 데이터 준비
- train/validation/test split 생성
- tokenizer 파인튜닝
- predictor 파인튜닝
- 간단한 top-K 전략 백테스트
다만 저장소도 명시하듯 이 파이프라인은 데모다. 실전 퀀트 전략에서는 raw prediction을 바로 매매 신호로 쓰기보다 포트폴리오 최적화, 위험 요인 중립화, 거래비용·슬리피지·시장충격 모델링이 필요하다.
사용 시 주의점
- 금융 예측 모델은 과거 패턴을 학습할 뿐 수익을 보장하지 않는다.
- 공개 예제의 백테스트는 생산용 전략 검증으로 부족하다.
- 데이터 누수, survivorship bias, 거래비용 누락을 별도로 점검해야 한다.
- 모델 출력은 “순수 알파”가 아니라 후처리 전 raw signal에 가깝다.
누가 쓰면 좋은가
- 금융 시계열 파운데이션 모델을 실험하려는 ML 연구자
- OHLCV 기반 예측 모델을 Hugging Face 모델로 빠르게 테스트하려는 퀀트 개발자
- Qlib 기반 데이터 파이프라인에 사전학습 모델을 붙여보고 싶은 팀
- 금융 데이터 토큰화와 autoregressive forecasting 구조를 연구하는 사람
참고 자료
- shiyu-coder/Kronos — GitHub 공식 저장소
- Kronos: A Foundation Model for the Language of Financial Markets — arXiv (2025)