DeepSeek
DeepSeek·MiniMax의 Claude 1600만 쿼리 추출, Anthropic이 밝힌 AI 증류 공격의 실체
Anthropic이 중국 AI 3사의 Claude 무단 증류를 공식 고발했습니다. 1,600만 건 데이터 추출의 실체와 업계의 “위선” 논란까지 정리했습니다.
Written by

GLM-5 등장, 744B 파라미터 오픈소스 모델이 에이전트 벤치마크 1위
Z.ai가 744B 파라미터 오픈소스 모델 GLM-5를 공개했습니다. DeepSeek 기술을 통합해 에이전트 작업에 특화된 성능을 보여줍니다.
Written by

DeepSeek OCR 2, 비주얼 토큰 80% 줄이고 Gemini 3 Pro 능가
DeepSeek OCR 2가 비주얼 토큰을 80% 줄이면서도 Gemini 3 Pro를 능가한 비결. 의미 기반 이미지 재배열로 문서 AI의 새 지평을 엽니다.
Written by

중국 정부가 만든 3,739개 AI 지도, DeepSeek은 우연이 아니었다
중국 정부의 AI 알고리즘 등록 시스템이 공개한 3,739개 AI 도구 데이터. DeepSeek은 우연이 아니라 치열한 국내 경쟁의 결과였습니다.
Written by

LLM 쿼리 하나에 전기 얼마나 쓸까, DeepSeek부터 GPT까지 에너지 실측
LLM 쿼리 하나에 실제로 얼마나 전기가 쓰일까? DeepSeek R1부터 GPT-OSS-120B까지 오픈소스 벤치마크 데이터로 실측한 에너지 비용과 벤치마크의 함정을 분석합니다.
Written by

DeepSeek, AI 학습 불안정성을 3000배→1.6배로 잡다: mHC 아키텍처의 비밀
DeepSeek의 mHC 아키텍처가 대규모 AI 모델 학습의 불안정성 문제를 어떻게 해결했는지 소개합니다. 신호 증폭 3000배→1.6배 개선으로 안정성과 성능을 동시에 확보한 비결을 설명합니다.
Written by

2025년 LLM 혁명: RLVR로 훈련비용 90% 절감, 추론 모델의 시대가 왔다
2025년 LLM 분야를 장악한 RLVR+GRPO 기술과 훈련 비용 혁명. 벤치마크의 함정부터 LLM을 슈퍼파워로 활용하는 법까지, Sebastian Raschka의 연례 리뷰를 소개합니다.
Written by

DeepSeek, 금지된 엔비디아 Blackwell 칩 수천 개 밀반입 논란
저비용 AI 모델로 주목받던 DeepSeek가 금지된 엔비디아 Blackwell 칩을 밀반입해 사용 중이라는 의혹. 엔비디아는 강하게 부인했습니다.
Written by

DeepSeek V3.2, 추론 비용 70% 낮춘 AI 모델로 GPT-5에 도전장
중국 DeepSeek가 추론 비용 70% 절감한 AI 모델 V3.2로 GPT-5에 도전장. 올림피아드 금메달급 성능을 MIT 라이선스로 무료 공개한 배경과 의미.
Written by

AI 버블 $1.5조 vs 닷컴 버블 $360B: 역사는 반복된다
닷컴 버블을 취재한 베테랑 저널리스트들이 현재 AI 투자 열풍($1.5조)을 1999년($360B)과 비교 분석합니다. OpenAI의 재무 구조, NVIDIA의 순환 투자, 그리고 중국 변수까지.
Written by
