Skip to content
LlamaPDFLlamaPDF
🔍

PDF 텍스트 추출 (OCR)

스캔된 PDF에서 텍스트 추출

마지막 업데이트:

OCR은 이미지와 PDF에서 텍스트를 뽑아내는 기능입니다. LlamaPDF는 먼저 PDF에 선택 가능한 텍스트 레이어가 이미 있는지 확인해 있으면 그대로 복사하므로 빠르고 무손실입니다. 없거나 이미지일 때는 브라우저 안에서 돌아가는 Tesseract.js로 전환되며 100+ languages를 자동 감지 옵션과 함께 지원합니다.

파일을 여기에 드래그 앤 드롭하세요

또는 클릭하여 선택

.PDF.JPG.PNG.WEBP

최대 50 MB · 회원가입 불필요

파일은 기기에 남아 있습니다 — 업로드되지 않습니다

OCR로 텍스트를 인식하는 방법

  1. 1

    LlamaPDF에 스캔한 PDF 또는 이미지를 업로드합니다.

  2. 2

    텍스트 언어를 선택합니다.

  3. 3

    편집 가능한 텍스트 또는 검색 가능한 PDF를 다운로드합니다.

OCR을 사용해야 하는 이유

스캔한 문서, 책, 사진의 텍스트를 검색·편집 가능하게 만들려면 LlamaPDF의 OCR 도구를 사용하세요.

다국어 지원 OCR을 무료로 제공합니다. 스마트폰에서도 이용할 수 있습니다.

OCR 기술이란?

OCR(광학 문자 인식)은 이미지나 스캔한 PDF의 텍스트를 인식하여 편집·검색 가능한 형식으로 변환하는 기술입니다. LlamaPDF는 100개 이상의 언어를 지원합니다.

자주 묻는 질문

OCR은 어떤 언어를 지원합니까?

Tesseract.js를 통해 100여 개 이상의 언어를 지원합니다. 드롭다운에서 원하는 언어를 선택하거나, 다국어가 혼합된 문서의 경우 최대 3개 언어를 조합해 사용할 수 있습니다.

텍스트 추출의 정확도는 얼마나 됩니까?

선명하고 고해상도인 스캔에서는 일반적으로 90~98%의 정확도를 달성합니다.

100페이지 PDF가 왜 가끔 1초 만에 끝나나요?

PDF에 이미 선택 가능한 텍스트 레이어가 있는 경우(스캔이 아닌 네이티브 PDF), OCR을 실행하지 않고 텍스트를 직접 추출합니다. 텍스트 레이어가 없는 스캔된 PDF의 경우에만 모든 페이지에 대해 OCR이 실행됩니다.

관련 도구