Skip to content
LlamaPDFLlamaPDF
🔍

PDF 轉文字 (OCR)

從掃描 PDF 中擷取文字

最後更新:

OCR 會從圖片與 PDF 中擷取文字。LlamaPDF 會先檢查 PDF 是否已經包含可選取的文字層,並直接複製 — 快速且無損。若否(或對於圖片),則退而使用完全在您的瀏覽器中執行的 Tesseract.js,支援 100+ 種語言並可選擇自動偵測。

將檔案拖放至此處

點擊選擇檔案

.PDF.JPG.PNG.WEBP

最大 50 MB · 無需註冊

您的檔案留在裝置上 — 永不上傳

如何使用 OCR 辨識文字

  1. 1

    將掃描的 PDF 或影像上傳至 LlamaPDF。

  2. 2

    選擇文字語言。

  3. 3

    下載可編輯的文字或可搜尋的 PDF。

為什麼要使用 OCR?

將掃描文件、書籍或照片中的文字轉為可搜尋和可編輯的內容,使用 LlamaPDF 的 OCR 工具

支援多語言 OCR,完全免費,支援手機使用。

OCR 技術說明

OCR(光學字元辨識)技術辨識影像或掃描 PDF 中的文字,並將其轉換為可編輯、可搜尋的格式。LlamaPDF 支援 100 種以上的語言。

常見問題

OCR 支援哪些語言?

透過 Tesseract.js 支援 100 多種語言。您可以從下拉式選單中選擇任何一種語言,或為混合語言文件組合最多 3 種語言。

文字擷取的準確率如何?

清晰、高解析度的掃描通常可達到 90–98% 的準確率。

為何有時 100 頁的 PDF 一秒就處理完?

如果 PDF 本身已經有可選取的文字層(原生 PDF,而非掃描檔),工具會直接擷取文字,而不會執行 OCR。對沒有文字層的掃描 PDF,才會對每一頁執行完整的 OCR。

相關工具