LFM2.5-230M – 라즈베리파이와 스마트폰에서 도는 2.3억 파라미터 온디바이스 모델

왜 중요한가
학습과 후처리
적합한 사용 사례
한계
관련 문서
참고 자료

LFM2.5-230M은 Liquid AI가 공개한 2.3억 파라미터급 오픈 가중치 소형 언어 모델이다. 클라우드 GPU보다 엣지 디바이스, 저가 CPU, 로컬 에이전트 워크플로를 겨냥하며, 툴 호출(tool calling)과 구조화 데이터 추출 같은 실용 작업에 초점을 맞춘다.

왜 중요한가

대부분의 에이전트 워크플로는 모든 단계를 대형 모델에 맡길 필요가 없다. 명령 분류, 필드 추출, 간단한 툴 선택, 로컬 장치 제어처럼 짧고 반복적인 단계는 작은 모델이 더 싸고 빠르다. LFM2.5-230M은 이 영역을 위해 만들어진 모델이다.

Liquid AI는 Galaxy S25 Ultra에서 초당 213 토큰 디코드, Raspberry Pi 5에서 초당 42 토큰 디코드 성능을 제시했다. 절대 지능보다 “어디서든 충분히 빠르게 돈다”는 점이 핵심이다.

학습과 후처리

LFM2.5-230M은 19T 토큰으로 사전학습됐고, 32K 컨텍스트 확장 단계를 포함한다. 후처리는 세 단계로 구성된다.

단계	역할
지도 파인튜닝	LFM2.5-350M에서 지식 증류
DPO	선호도 기반 응답 정렬
다중 도메인 강화학습	툴 호출·추출 등 실제 작업 품질 보강

이 조합은 대형 범용 추론 모델을 만들기보다, 개발자가 자기 도메인에 빠르게 파인튜닝할 수 있는 기초 모델을 만드는 방향이다.

적합한 사용 사례

모바일 앱 안에서 실행하는 개인정보 보호형 텍스트 분류·추출
라즈베리파이, Jetson, 저가 CPU에서 동작하는 로컬 에이전트
대형 모델 호출 전에 입력을 정리하는 전처리 모델
로봇이나 IoT 장치에서 자연어 명령을 구조화된 스킬 호출로 바꾸는 계층
대량 문서에서 단순 필드 추출을 반복하는 저비용 파이프라인

Liquid AI는 Unitree G1 휴머노이드 로봇에서 LFM2.5-230M을 온디바이스 스킬 선택 계층으로 실험했다. 자연어 명령을 걷기, 정지, 자세 유지 같은 저수준 스킬 호출 시퀀스로 바꾸는 식이다.

한계

이 모델은 고급 수학, 복잡한 코드 생성, 긴 창의적 글쓰기처럼 깊은 추론이 필요한 작업에는 맞지 않는다. 작은 모델을 에이전트에 넣을 때는 “최종 답변자”보다 “분류기·라우터·추출기·로컬 컨트롤러”로 쓰는 편이 현실적이다.

참고 자료

LFM2.5-230M: Built to Run Anywhere — Liquid AI Blog (2026-06-25)

Like?

AI Sparkup

LFM2.5-230M – 라즈베리파이와 스마트폰에서 도는 2.3억 파라미터 온디바이스 모델

왜 중요한가

학습과 후처리

적합한 사용 사례

한계

관련 문서

참고 자료

AI Sparkup 구독하기