MoE
-
DeepSeek V3-0324: 코드 생성 능력과 추론 성능이 대폭 향상된 최신 오픈소스 LLM
중국 AI 연구소 DeepSeek이 개발한 DeepSeek V3-0324는 700줄의 코드를 오류 없이 생성하고 이전보다 향상된 추론 능력과 웹 개발 성능을 제공하는 최신 오픈소스 AI 모델입니다. 이 기사에서는 모델의 주요 개선 사항, 기술적 특징, 그리고 실제 활용 사례를 탐색합니다.
Written by
-
텐센트의 혁신, ‘훈위안-T1’—세계 최초 맘바 기반 초대형 AI 모델로 추론 효율성을 재정의하다
텐센트가 출시한 세계 최초의 맘바 기반 초대형 AI 모델 ‘훈위안-T1’이 GPT-4.5를 뛰어넘는 성능을 보여주고 있습니다. 강화학습과 하이브리드 아키텍처를 활용한 이 혁신적 모델의 특징과 미래 전망을 소개합니다.
Written by