LFM2.5-8B-A1B – 온디바이스 실행에 최적화된 Liquid AI의 경량 MoE 모델

왜 만들어졌나
핵심 특징
환각 억제: avg@k 기반 보상
벤치마크 성능
누가 쓰면 좋은가
관련 문서
라이선스
참고 자료

LFM2.5-8B-A1B는 Liquid AI가 공개한 엣지 추론 특화 언어 모델로, 총 8B 파라미터 중 추론 시 1B만 활성화되는 혼합 전문가(MoE, Mixture-of-Experts) 구조를 채택했다. 소비자용 하드웨어에서 빠르고 안정적인 툴 호출(tool calling)과 복잡한 명령 수행을 목표로 설계됐으며, avg@k 기반 보상 방식으로 환각(hallucination)율을 대폭 낮춘 것이 특징이다.

왜 만들어졌나

클라우드 API를 거치지 않고 기기에서 직접 LLM을 실행하는 온디바이스(on-device) 추론 수요가 커지면서, 정확도·속도·메모리 사용량을 동시에 만족하는 경량 모델에 대한 요구가 높아졌다. Liquid AI는 LFM2(Liquid Foundation Model 2) 시리즈의 후속작으로 LFM2.5-8B-A1B를 출시해 이 요구에 대응했다.

핵심 특징

항목	내용
총 파라미터	8B
활성 파라미터	1B (추론 시)
구조	혼합 전문가(MoE)
주요 용도	툴 호출, 복잡한 명령 수행, 에이전틱 워크플로
타깃 하드웨어	소비자용(consumer) 기기

환각 억제: avg@k 기반 보상

LFM2.5-8B-A1B의 핵심 훈련 기법은 avg@k 기반 보상이다. 동일 프롬프트에 대해 k개의 출력을 생성하고, 그 평균 정확도를 보상 신호로 사용한다. 이를 통해 정확도를 유지하면서도 환각률을 크게 낮출 수 있다. Artificial Analysis의 Omniscience Index 기준(정답에는 +점수, 환각에는 -점수)에서도 우수한 성적을 기록했다.

벤치마크 성능

지식, 명령 수행, 수학, 에이전틱 워크플로 등 다양한 분야의 벤치마크에서 평가가 이루어졌다. 특히 명령 수행 벤치마크에서는 활성 파라미터 대비 훨씬 큰 모델인 Gemma 4-26B와 동등한 성능을 보였다. 즉, 비슷한 총 파라미터 수의 밀집(dense) 모델은 물론, 훨씬 큰 MoE 모델과도 경쟁할 수 있는 수준이다.

누가 쓰면 좋은가

사용자	시나리오
엣지·임베디드 앱 개발자	클라우드 의존 없이 기기에서 LLM 추론이 필요한 경우
에이전트 빌더	툴 호출과 복잡한 지시 수행이 필요한 경량 에이전트
AI 연구자	MoE 구조의 온디바이스 효율성 연구

라이선스

공개 라이선스 (Liquid AI 공식 사이트 확인 필요)

참고 자료

LFM2.5-8B-A1B: An Even Better On-Device Mixture of Experts — Liquid AI Blog (2026-05-31)

Like?

AI Sparkup