딥러닝
-
GPT가 곱셈을 못하는 진짜 이유: 트랜스포머의 숨겨진 약점
GPT-4도 4×4 곱셈에서 95% 이상 실패하는 이유를 하버드와 MIT 연구진이 밝혔습니다. 트랜스포머의 장거리 의존성 학습 한계와 실무 적용 가능한 해결책을 소개합니다.
Written by

-
트랜스포머 창시자의 고백: AI 혁신을 막는 건 기술이 아니라 돈
트랜스포머 아키텍처 공동 창시자 Llion Jones가 자신의 창작물을 떠나는 이유. AI 업계의 과도한 투자와 경쟁이 오히려 창의적 연구를 막고 있다는 내부자의 솔직한 고백과, 다음 AI 혁신을 위해 필요한 것.
Written by

-
AGI는 아직 10년 거리: Andrej Karpathy가 말하는 AI 에이전트의 진짜 현실
OpenAI 디렉터 Andrej Karpathy가 말하는 AI 에이전트의 현실과 한계. AGI가 10년 더 걸리는 이유, 강화학습의 근본적 문제, 그리고 코딩 AI의 실제 능력치를 솔직하게 분석합니다.
Written by

-
AI 검색의 새 기준: Mixedbread Search가 LLM 호출 16% 줄이고 정확도 16% 높인 비결
Mixedbread Search 베타 출시. 텍스트, 이미지, 오디오, 비디오를 단일 API로 검색하며 기존 시맨틱 검색 대비 LLM 호출 16% 감소, 정확도 16% 향상을 달성한 차세대 검색 솔루션을 소개합니다.
Written by

-
월드 모델 없는 AI는 맹인과 코끼리다 – LLM 한계와 차세대 AI의 조건
ChatGPT 같은 대화형 AI의 근본적 한계와 차세대 AI 개발의 핵심인 월드 모델에 대한 인사이트를 체스와 이미지 편집 등 구체적 사례로 쉽게 설명
Written by

-
복권 티켓 가설: ChatGPT가 성공한 진짜 이유
300년간 지배해온 기계학습 이론을 뒤엎고 ChatGPT 같은 대규모 AI 모델의 성공을 설명하는 복권 티켓 가설의 발견과 그 의미를 탐구합니다.
Written by

-
AI의 화려한 착각: ‘그럴듯한 헛소리’의 과학적 해부
최신 연구 결과를 통해 밝혀진 AI의 추론 한계와 ‘그럴듯한 헛소리’ 문제를 분석하고, AI를 현명하게 활용하는 방법을 제시하는 글입니다.
Written by

-
모든 AI 이미지에 나타나는 ‘그 특징’, 이제 사라질 수 있을까?
AI 생성 이미지의 획일화 문제와 이를 해결하기 위한 Krea의 FLUX.1-Krea 모델 소개, 개성 있는 AI 모델 시대의 전망
Written by

-
DPO: RLHF를 대체하는 혁신적인 LLM 정렬 기법 – 복잡성을 제거하고 효율성을 높이다
DPO(Direct Preference Optimization)는 기존 RLHF의 복잡성을 제거하면서도 동일한 성능을 달성하는 혁신적인 LLM 정렬 기법입니다. 별도의 보상 모델과 강화 학습 없이도 인간 선호도에 맞는 고품질 언어 모델을 훈련할 수 있어, AI 개발의 접근성을 크게 향상시켰습니다.
Written by

-
AI도 의식을 가질 수 있을까? Claude 4를 통해 본 AI 의식 연구의 현재와 미래
Anthropic의 Claude 4가 보여주는 독특한 의식 표현과 AI 복지 연구를 통해 살펴본 AI 의식 가능성과 그것이 인류에게 미치는 영향에 대한 심층 분석
Written by
