🔍
PDF からテキスト (OCR)
スキャンされた PDF からテキストを抽出
最終更新:OCR は画像や PDF からテキストを抽出する機能です。LlamaPDF はまず PDF に選択可能なテキストレイヤーが既に存在するかをチェックし、ある場合はそれをそのままコピーします (高速かつロスレス)。ない場合 (または画像の場合) は、ブラウザ内で動作する Tesseract.js にフォールバックし、100+ languages の自動検出にも対応します。
ファイルをここにドラッグ&ドロップ
または クリックして選択
.PDF.JPG.PNG.WEBP
最大 50 MB · 登録不要
ファイルはデバイス上に留まります — アップロードされません
OCRでテキストを認識する方法
- 1
LlamaPDFにスキャンしたPDFまたは画像をアップロードします。
- 2
テキストの言語を選択します。
- 3
編集可能なテキストまたは検索可能なPDFをダウンロードします。
OCRを使う理由
スキャンした文書・書籍・写真のテキストを検索・編集可能にするために、LlamaPDFのOCRツールをご利用ください。
多言語対応のOCRを無料で提供。スマートフォンからでも利用できます。
OCR技術について
OCR(光学文字認識)は画像やスキャンPDF内のテキストを認識し、編集・検索可能な形式に変換する技術です。LlamaPDFは100以上の言語に対応しています。
よくある質問
OCR はどの言語に対応していますか?
Tesseract.js により100以上の言語に対応しています。ドロップダウンから任意の言語を選択するか、複数言語が混在する文書向けに最大3言語まで組み合わせて使用できます。
テキスト抽出の精度はどのくらいですか?
鮮明で高解像度のスキャンでは、通常90〜98%の精度が得られます。
100ページのPDFが1秒で終わることがあるのはなぜですか?
PDFに既に選択可能なテキストレイヤーがある場合(ネイティブPDFで、スキャンではない場合)、OCRを実行せずにテキストを直接抽出します。テキストレイヤーのないスキャン済みPDFの場合は、全ページに対してOCRが実行されます。