머신러닝
-
Docker Model Runner로 로컬에서 LLM 구동하기
Docker의 새로운 기능인 Model Runner를 활용하여 로컬 환경에서 LLM을 쉽게 구동하는 방법을 소개합니다. 개념부터 실제 사용법까지 상세히 알아봅니다.
Written by
-
AI 추론과 훈련: 인공지능의 두 가지 핵심 단계를 이해하기
AI 시스템의 두 가지 핵심 단계인 ‘훈련(Training)’과 ‘추론(Inference)’에 대해 알아봅니다. 이 두 단계의 차이점과 중요성을 이해하고, AI 시스템이 어떻게 작동하는지 더 깊이 파악해 보세요.
Written by
-
ModernBERT: 차세대 인코더 모델의 새로운 지평
ModernBERT는 BERT의 후속 모델로, 속도와 정확도 면에서 획기적인 개선을 이룬 인코더 전용 모델입니다. 이 글에서는 ModernBERT의 주요 특징, 기술적 혁신, 그리고 AI 개발에서의 활용 방안을 자세히 알아봅니다.
Written by
-
넷플릭스의 혁신: 기초 모델 기반 개인화 추천 시스템의 미래
넷플릭스가 300백만 이상의 사용자 데이터를 활용해 개발한 기초 모델(Foundation Model) 기반 추천 시스템에 대해 알아봅니다. 대규모 언어 모델에서 영감을 받은 이 혁신적인 접근법이 어떻게 더 정확하고 개인화된 콘텐츠 추천을 가능하게 하는지 살펴봅니다.
Written by
-
제로에서 히어로까지: Hugging Face와 Databricks로 생성형 AI 애플리케이션 구축하기
Hugging Face 모델과 Databricks 플랫폼을 활용하여 엔터프라이즈급 생성형 AI 애플리케이션을 구축하는 방법을 단계별로 소개합니다. Unity Catalog, MLflow, Model Serving 및 Databricks Apps를 활용한 전체 개발 과정을 통해 쉽고 빠르게 생성형 AI의 힘을 비즈니스에 적용해보세요.
Written by
-
Agno 프레임워크로 구축하는 가벼운 멀티모달 AI 에이전트
멀티모달 AI 에이전트 개발을 위한 경량 프레임워크 Agno를 소개합니다. LangGraph보다 10,000배 빠르고 메모리는 50배 더 적게 사용하는 이 프레임워크는 어떤 성능과 기능을 제공하는지 알아봅니다.
Written by
-
소형 AI 모델 대결: QwQ 32B vs. Gemma 3 27B vs. Mistral Small 24B vs. Deepseek R1 비교 분석
32B 파라미터급 소형 AI 모델들(QwQ 32B, Gemma 3 27B, Mistral Small 24B)의 성능을 Deepseek R1과 비교 분석한 글입니다. 코딩, 추론, 수학 능력 테스트를 통해 각 모델의 강점과 약점을 살펴보고, 어떤 상황에서 어떤 모델을 선택해야 하는지 인사이트를 제공합니다.
Written by
-
DeepSeek의 오픈소스 전략: AI 경제의 새로운 패러다임
DeepSeek이 84.5%의 놀라운 수익률을 기록하면서도 8개의 혁신 기술을 오픈소스로 공개한 전략적 행보를 분석합니다. AI 모델의 가격 하락, 소규모 연구소의 부상, 그리고 AI 기술 발전 가속화라는 세 가지 변화가 2025년 이후 AI 경제에 미칠 영향을 조망합니다.
Written by
-
AI 에이전트: 인공지능의 다음 진화 단계
AI 챗봇을 넘어선 다음 단계, AI 에이전트의 핵심 구성 요소와 실제 활용 사례를 알아봅니다. 메모리, 도구, 계획 능력을 갖춘 AI 에이전트가 어떻게 작동하고 우리의 일상과 업무를 변화시킬 수 있는지 탐색합니다.
Written by
-
에어비앤비 검색 시스템의 진화: 임베딩 기반 검색 기술로 완성한 개인화된 숙소 추천
에어비앤비가 수백만 개의 숙소에서 사용자에게 가장 적합한 숙소를 찾아주기 위해 구축한 임베딩 기반 검색(EBR) 시스템에 대해 알아봅니다. 머신러닝을 활용한 벡터 검색 기술로 검색 품질과 속도를 모두 향상시킨 사례를 소개합니다.
Written by