AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

LFM2.5-8B-A1B – 온디바이스 실행에 최적화된 Liquid AI의 경량 MoE 모델

LFM2.5-8B-A1B는 Liquid AI가 공개한 엣지 추론 특화 언어 모델로, 총 8B 파라미터 중 추론 시 1B만 활성화되는 혼합 전문가(MoE, Mixture-of-Experts) 구조를 채택했다. 소비자용 하드웨어에서 빠르고 안정적인 툴 호출(tool calling)과 복잡한 명령 수행을 목표로 설계됐으며, avg@k 기반 보상 방식으로 환각(hallucination)율을 대폭 낮춘 것이 특징이다.

왜 만들어졌나

클라우드 API를 거치지 않고 기기에서 직접 LLM을 실행하는 온디바이스(on-device) 추론 수요가 커지면서, 정확도·속도·메모리 사용량을 동시에 만족하는 경량 모델에 대한 요구가 높아졌다. Liquid AI는 LFM2(Liquid Foundation Model 2) 시리즈의 후속작으로 LFM2.5-8B-A1B를 출시해 이 요구에 대응했다.

핵심 특징

항목내용
총 파라미터8B
활성 파라미터1B (추론 시)
구조혼합 전문가(MoE)
주요 용도툴 호출, 복잡한 명령 수행, 에이전틱 워크플로
타깃 하드웨어소비자용(consumer) 기기

환각 억제: avg@k 기반 보상

LFM2.5-8B-A1B의 핵심 훈련 기법은 avg@k 기반 보상이다. 동일 프롬프트에 대해 k개의 출력을 생성하고, 그 평균 정확도를 보상 신호로 사용한다. 이를 통해 정확도를 유지하면서도 환각률을 크게 낮출 수 있다. Artificial Analysis의 Omniscience Index 기준(정답에는 +점수, 환각에는 -점수)에서도 우수한 성적을 기록했다.

벤치마크 성능

지식, 명령 수행, 수학, 에이전틱 워크플로 등 다양한 분야의 벤치마크에서 평가가 이루어졌다. 특히 명령 수행 벤치마크에서는 활성 파라미터 대비 훨씬 큰 모델인 Gemma 4-26B와 동등한 성능을 보였다. 즉, 비슷한 총 파라미터 수의 밀집(dense) 모델은 물론, 훨씬 큰 MoE 모델과도 경쟁할 수 있는 수준이다.

누가 쓰면 좋은가

사용자시나리오
엣지·임베디드 앱 개발자클라우드 의존 없이 기기에서 LLM 추론이 필요한 경우
에이전트 빌더툴 호출과 복잡한 지시 수행이 필요한 경량 에이전트
AI 연구자MoE 구조의 온디바이스 효율성 연구

라이선스

공개 라이선스 (Liquid AI 공식 사이트 확인 필요)

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)