LFM2.5-230M은 Liquid AI가 공개한 2.3억 파라미터급 오픈 가중치 소형 언어 모델이다. 클라우드 GPU보다 엣지 디바이스, 저가 CPU, 로컬 에이전트 워크플로를 겨냥하며, 툴 호출(tool calling)과 구조화 데이터 추출 같은 실용 작업에 초점을 맞춘다.
왜 중요한가
대부분의 에이전트 워크플로는 모든 단계를 대형 모델에 맡길 필요가 없다. 명령 분류, 필드 추출, 간단한 툴 선택, 로컬 장치 제어처럼 짧고 반복적인 단계는 작은 모델이 더 싸고 빠르다. LFM2.5-230M은 이 영역을 위해 만들어진 모델이다.
Liquid AI는 Galaxy S25 Ultra에서 초당 213 토큰 디코드, Raspberry Pi 5에서 초당 42 토큰 디코드 성능을 제시했다. 절대 지능보다 “어디서든 충분히 빠르게 돈다”는 점이 핵심이다.
학습과 후처리
LFM2.5-230M은 19T 토큰으로 사전학습됐고, 32K 컨텍스트 확장 단계를 포함한다. 후처리는 세 단계로 구성된다.
| 단계 | 역할 |
|---|---|
| 지도 파인튜닝 | LFM2.5-350M에서 지식 증류 |
| DPO | 선호도 기반 응답 정렬 |
| 다중 도메인 강화학습 | 툴 호출·추출 등 실제 작업 품질 보강 |
이 조합은 대형 범용 추론 모델을 만들기보다, 개발자가 자기 도메인에 빠르게 파인튜닝할 수 있는 기초 모델을 만드는 방향이다.
적합한 사용 사례
- 모바일 앱 안에서 실행하는 개인정보 보호형 텍스트 분류·추출
- 라즈베리파이, Jetson, 저가 CPU에서 동작하는 로컬 에이전트
- 대형 모델 호출 전에 입력을 정리하는 전처리 모델
- 로봇이나 IoT 장치에서 자연어 명령을 구조화된 스킬 호출로 바꾸는 계층
- 대량 문서에서 단순 필드 추출을 반복하는 저비용 파이프라인
Liquid AI는 Unitree G1 휴머노이드 로봇에서 LFM2.5-230M을 온디바이스 스킬 선택 계층으로 실험했다. 자연어 명령을 걷기, 정지, 자세 유지 같은 저수준 스킬 호출 시퀀스로 바꾸는 식이다.
한계
이 모델은 고급 수학, 복잡한 코드 생성, 긴 창의적 글쓰기처럼 깊은 추론이 필요한 작업에는 맞지 않는다. 작은 모델을 에이전트에 넣을 때는 “최종 답변자”보다 “분류기·라우터·추출기·로컬 컨트롤러”로 쓰는 편이 현실적이다.
관련 문서
- lfm2-5-8b-a1b — 더 큰 온디바이스 MoE 계열 LFM 모델
- lfm2-5-retrievers — Liquid AI의 검색 특화 LFM 계열
- local-slm — 내 컴퓨터에서 실행하는 소형 언어 모델 개요
- local-slm-tips-agentic-workflows — 로컬 SLM을 에이전트 워크플로에 배치하는 방법
참고 자료
- LFM2.5-230M: Built to Run Anywhere — Liquid AI Blog (2026-06-25)