🔍
PDF 텍스트 추출 (OCR)
스캔된 PDF에서 텍스트 추출
마지막 업데이트:OCR은 이미지와 PDF에서 텍스트를 뽑아내는 기능입니다. LlamaPDF는 먼저 PDF에 선택 가능한 텍스트 레이어가 이미 있는지 확인해 있으면 그대로 복사하므로 빠르고 무손실입니다. 없거나 이미지일 때는 브라우저 안에서 돌아가는 Tesseract.js로 전환되며 100+ languages를 자동 감지 옵션과 함께 지원합니다.
파일을 여기에 드래그 앤 드롭하세요
또는 클릭하여 선택
.PDF.JPG.PNG.WEBP
최대 50 MB · 회원가입 불필요
파일은 기기에 남아 있습니다 — 업로드되지 않습니다
OCR로 텍스트를 인식하는 방법
- 1
LlamaPDF에 스캔한 PDF 또는 이미지를 업로드합니다.
- 2
텍스트 언어를 선택합니다.
- 3
편집 가능한 텍스트 또는 검색 가능한 PDF를 다운로드합니다.
OCR을 사용해야 하는 이유
스캔한 문서, 책, 사진의 텍스트를 검색·편집 가능하게 만들려면 LlamaPDF의 OCR 도구를 사용하세요.
다국어 지원 OCR을 무료로 제공합니다. 스마트폰에서도 이용할 수 있습니다.
OCR 기술이란?
OCR(광학 문자 인식)은 이미지나 스캔한 PDF의 텍스트를 인식하여 편집·검색 가능한 형식으로 변환하는 기술입니다. LlamaPDF는 100개 이상의 언어를 지원합니다.
자주 묻는 질문
OCR은 어떤 언어를 지원합니까?
Tesseract.js를 통해 100여 개 이상의 언어를 지원합니다. 드롭다운에서 원하는 언어를 선택하거나, 다국어가 혼합된 문서의 경우 최대 3개 언어를 조합해 사용할 수 있습니다.
텍스트 추출의 정확도는 얼마나 됩니까?
선명하고 고해상도인 스캔에서는 일반적으로 90~98%의 정확도를 달성합니다.
100페이지 PDF가 왜 가끔 1초 만에 끝나나요?
PDF에 이미 선택 가능한 텍스트 레이어가 있는 경우(스캔이 아닌 네이티브 PDF), OCR을 실행하지 않고 텍스트를 직접 추출합니다. 텍스트 레이어가 없는 스캔된 PDF의 경우에만 모든 페이지에 대해 OCR이 실행됩니다.