텍스트생성
-
BERT는 텍스트 디퓨전 모델이었다: RoBERTa로 30분 만에 만든 생성 AI
BERT의 마스크 언어 모델링이 사실 디퓨전 모델의 한 형태였다는 발견과, RoBERTa를 30분 학습으로 텍스트 생성 모델로 전환한 실험을 소개합니다.
Written by

-
트랜스포머 모델의 텍스트 생성 파라미터 완전 가이드
트랜스포머 모델에서 텍스트 생성의 품질을 결정짓는 핵심 파라미터인 Temperature, Top-K, Top-P, Repetition Penalty 등을 상세히 설명하고, 다양한 응용 분야별 최적 설정과 실제 코드 예제를 통해 활용법을 안내하는 실용 가이드입니다.
Written by
