PP-OCRv6는 PaddleOCR가 공개한 OCR 모델 패밀리다. tiny, mobile, medium 세 단계로 제공되며 1.5M부터 34.5M 파라미터까지 선택할 수 있다. 목표는 edge device부터 서버 OCR까지 같은 계열 안에서 맞추는 것이다.
무엇이 바뀌었나
PP-OCRv6는 텍스트 검출에 RepLKFPN, 인식에 EncoderWithLightSVTR를 사용한다. PaddleOCR의 자체 벤치마크 기준 medium 모델은 86.2% detection Hmean, 83.2% recognition accuracy를 기록했다고 공개됐다. PP-OCRv5_server 대비 검출과 인식 모두 개선됐다는 점이 강조된다.
모델 티어
| 모델 | 파라미터 | 용도 |
|---|---|---|
| PP-OCRv6_tiny | 1.5M | edge, 데모, 지연시간 민감 환경 |
| PP-OCRv6_mobile | 중간 크기 | 모바일·로컬 앱 |
| PP-OCRv6_medium | 34.5M | 정확도가 중요한 서버 OCR |
50개 언어를 지원하므로 다국어 문서 처리, 영수증·계약서·이미지 검색 인덱싱 같은 작업에 적용할 수 있다.
관련 문서
- rag-tips-image-indexing — 기술 문서 이미지를 캡셔닝해 텍스트처럼 검색하기
- whisper-cpp — 로컬 미디어 처리 파이프라인의 음성 인식 구성요소
참고 자료
- PP-OCRv6 on Hugging Face: 50-Language OCR from 1.5M to 34.5M Parameters — Hugging Face / PaddlePaddle (2026-06)