AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

PP-OCRv6 – 50개 언어를 지원하는 경량 OCR 모델 패밀리

PP-OCRv6는 PaddleOCR가 공개한 OCR 모델 패밀리다. tiny, mobile, medium 세 단계로 제공되며 1.5M부터 34.5M 파라미터까지 선택할 수 있다. 목표는 edge device부터 서버 OCR까지 같은 계열 안에서 맞추는 것이다.

무엇이 바뀌었나

PP-OCRv6는 텍스트 검출에 RepLKFPN, 인식에 EncoderWithLightSVTR를 사용한다. PaddleOCR의 자체 벤치마크 기준 medium 모델은 86.2% detection Hmean, 83.2% recognition accuracy를 기록했다고 공개됐다. PP-OCRv5_server 대비 검출과 인식 모두 개선됐다는 점이 강조된다.

모델 티어

모델파라미터용도
PP-OCRv6_tiny1.5Medge, 데모, 지연시간 민감 환경
PP-OCRv6_mobile중간 크기모바일·로컬 앱
PP-OCRv6_medium34.5M정확도가 중요한 서버 OCR

50개 언어를 지원하므로 다국어 문서 처리, 영수증·계약서·이미지 검색 인덱싱 같은 작업에 적용할 수 있다.

관련 문서

  • rag-tips-image-indexing — 기술 문서 이미지를 캡셔닝해 텍스트처럼 검색하기
  • whisper-cpp — 로컬 미디어 처리 파이프라인의 음성 인식 구성요소

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)