LFM2.5-8B-A1B는 Liquid AI가 공개한 엣지 추론 특화 언어 모델로, 총 8B 파라미터 중 추론 시 1B만 활성화되는 혼합 전문가(MoE, Mixture-of-Experts) 구조를 채택했다. 소비자용 하드웨어에서 빠르고 안정적인 툴 호출(tool calling)과 복잡한 명령 수행을 목표로 설계됐으며, avg@k 기반 보상 방식으로 환각(hallucination)율을 대폭 낮춘 것이 특징이다.
왜 만들어졌나
클라우드 API를 거치지 않고 기기에서 직접 LLM을 실행하는 온디바이스(on-device) 추론 수요가 커지면서, 정확도·속도·메모리 사용량을 동시에 만족하는 경량 모델에 대한 요구가 높아졌다. Liquid AI는 LFM2(Liquid Foundation Model 2) 시리즈의 후속작으로 LFM2.5-8B-A1B를 출시해 이 요구에 대응했다.
핵심 특징
| 항목 | 내용 |
|---|---|
| 총 파라미터 | 8B |
| 활성 파라미터 | 1B (추론 시) |
| 구조 | 혼합 전문가(MoE) |
| 주요 용도 | 툴 호출, 복잡한 명령 수행, 에이전틱 워크플로 |
| 타깃 하드웨어 | 소비자용(consumer) 기기 |
환각 억제: avg@k 기반 보상
LFM2.5-8B-A1B의 핵심 훈련 기법은 avg@k 기반 보상이다. 동일 프롬프트에 대해 k개의 출력을 생성하고, 그 평균 정확도를 보상 신호로 사용한다. 이를 통해 정확도를 유지하면서도 환각률을 크게 낮출 수 있다. Artificial Analysis의 Omniscience Index 기준(정답에는 +점수, 환각에는 -점수)에서도 우수한 성적을 기록했다.
벤치마크 성능
지식, 명령 수행, 수학, 에이전틱 워크플로 등 다양한 분야의 벤치마크에서 평가가 이루어졌다. 특히 명령 수행 벤치마크에서는 활성 파라미터 대비 훨씬 큰 모델인 Gemma 4-26B와 동등한 성능을 보였다. 즉, 비슷한 총 파라미터 수의 밀집(dense) 모델은 물론, 훨씬 큰 MoE 모델과도 경쟁할 수 있는 수준이다.
누가 쓰면 좋은가
| 사용자 | 시나리오 |
|---|---|
| 엣지·임베디드 앱 개발자 | 클라우드 의존 없이 기기에서 LLM 추론이 필요한 경우 |
| 에이전트 빌더 | 툴 호출과 복잡한 지시 수행이 필요한 경량 에이전트 |
| AI 연구자 | MoE 구조의 온디바이스 효율성 연구 |
라이선스
공개 라이선스 (Liquid AI 공식 사이트 확인 필요)
참고 자료
- LFM2.5-8B-A1B: An Even Better On-Device Mixture of Experts — Liquid AI Blog (2026-05-31)