Skip to content
LlamaPDFLlamaPDF
🔍

PDF からテキスト (OCR)

スキャンされた PDF からテキストを抽出

最終更新:

OCR は画像や PDF からテキストを抽出する機能です。LlamaPDF はまず PDF に選択可能なテキストレイヤーが既に存在するかをチェックし、ある場合はそれをそのままコピーします (高速かつロスレス)。ない場合 (または画像の場合) は、ブラウザ内で動作する Tesseract.js にフォールバックし、100+ languages の自動検出にも対応します。

ファイルをここにドラッグ&ドロップ

または クリックして選択

.PDF.JPG.PNG.WEBP

最大 50 MB · 登録不要

ファイルはデバイス上に留まります — アップロードされません

OCRでテキストを認識する方法

  1. 1

    LlamaPDFにスキャンしたPDFまたは画像をアップロードします。

  2. 2

    テキストの言語を選択します。

  3. 3

    編集可能なテキストまたは検索可能なPDFをダウンロードします。

OCRを使う理由

スキャンした文書・書籍・写真のテキストを検索・編集可能にするために、LlamaPDFのOCRツールをご利用ください。

多言語対応のOCRを無料で提供。スマートフォンからでも利用できます。

OCR技術について

OCR(光学文字認識)は画像やスキャンPDF内のテキストを認識し、編集・検索可能な形式に変換する技術です。LlamaPDFは100以上の言語に対応しています。

よくある質問

OCR はどの言語に対応していますか?

Tesseract.js により100以上の言語に対応しています。ドロップダウンから任意の言語を選択するか、複数言語が混在する文書向けに最大3言語まで組み合わせて使用できます。

テキスト抽出の精度はどのくらいですか?

鮮明で高解像度のスキャンでは、通常90〜98%の精度が得られます。

100ページのPDFが1秒で終わることがあるのはなぜですか?

PDFに既に選択可能なテキストレイヤーがある場合(ネイティブPDFで、スキャンではない場合)、OCRを実行せずにテキストを直接抽出します。テキストレイヤーのないスキャン済みPDFの場合は、全ページに対してOCRが実行されます。

関連ツール