🔍

PDF 텍스트 추출 (OCR)

스캔된 PDF에서 텍스트 추출

마지막 업데이트: 2026년 5월 14일

OCR은 이미지와 PDF에서 텍스트를 뽑아내는 기능입니다. LlamaPDF는 먼저 PDF에 선택 가능한 텍스트 레이어가 이미 있는지 확인해 있으면 그대로 복사하므로 빠르고 무손실입니다. 없거나 이미지일 때는 브라우저 안에서 돌아가는 Tesseract.js로 전환되며 100+ languages를 자동 감지 옵션과 함께 지원합니다.

파일을 여기에 드래그 앤 드롭하세요

또는 클릭하여 선택

.PDF.JPG.PNG.WEBP

최대 50 MB · 회원가입 불필요

파일은 기기에 남아 있습니다 — 업로드되지 않습니다

OCR로 텍스트를 인식하는 방법

1
LlamaPDF에 스캔한 PDF 또는 이미지를 업로드합니다.
2
텍스트 언어를 선택합니다.
3
편집 가능한 텍스트 또는 검색 가능한 PDF를 다운로드합니다.

OCR을 사용해야 하는 이유

스캔한 문서, 책, 사진의 텍스트를 검색·편집 가능하게 만들려면 LlamaPDF의 OCR 도구를 사용하세요.

다국어 지원 OCR을 무료로 제공합니다. 스마트폰에서도 이용할 수 있습니다.

OCR 기술이란?

OCR(광학 문자 인식)은 이미지나 스캔한 PDF의 텍스트를 인식하여 편집·검색 가능한 형식으로 변환하는 기술입니다. LlamaPDF는 100개 이상의 언어를 지원합니다.

자주 묻는 질문

OCR은 어떤 언어를 지원합니까?

Tesseract.js를 통해 100여 개 이상의 언어를 지원합니다. 드롭다운에서 원하는 언어를 선택하거나, 다국어가 혼합된 문서의 경우 최대 3개 언어를 조합해 사용할 수 있습니다.

텍스트 추출의 정확도는 얼마나 됩니까?

선명하고 고해상도인 스캔에서는 일반적으로 90~98%의 정확도를 달성합니다.

100페이지 PDF가 왜 가끔 1초 만에 끝나나요?

PDF에 이미 선택 가능한 텍스트 레이어가 있는 경우(스캔이 아닌 네이티브 PDF), OCR을 실행하지 않고 텍스트를 직접 추출합니다. 텍스트 레이어가 없는 스캔된 PDF의 경우에만 모든 페이지에 대해 OCR이 실행됩니다.