🔍

PDF からテキスト (OCR)

スキャンされた PDF からテキストを抽出

最終更新: 2026年5月14日

OCR は画像や PDF からテキストを抽出する機能です。LlamaPDF はまず PDF に選択可能なテキストレイヤーが既に存在するかをチェックし、ある場合はそれをそのままコピーします (高速かつロスレス)。ない場合 (または画像の場合) は、ブラウザ内で動作する Tesseract.js にフォールバックし、100+ languages の自動検出にも対応します。

ファイルをここにドラッグ＆ドロップ

またはクリックして選択

.PDF.JPG.PNG.WEBP

最大 50 MB · 登録不要

ファイルはデバイス上に留まります — アップロードされません

OCRでテキストを認識する方法

1
LlamaPDFにスキャンしたPDFまたは画像をアップロードします。
2
テキストの言語を選択します。
3
編集可能なテキストまたは検索可能なPDFをダウンロードします。

OCRを使う理由

スキャンした文書・書籍・写真のテキストを検索・編集可能にするために、LlamaPDFのOCRツールをご利用ください。

多言語対応のOCRを無料で提供。スマートフォンからでも利用できます。

OCR技術について

OCR（光学文字認識）は画像やスキャンPDF内のテキストを認識し、編集・検索可能な形式に変換する技術です。LlamaPDFは100以上の言語に対応しています。

よくある質問

OCR はどの言語に対応していますか？

Tesseract.js により100以上の言語に対応しています。ドロップダウンから任意の言語を選択するか、複数言語が混在する文書向けに最大3言語まで組み合わせて使用できます。

テキスト抽出の精度はどのくらいですか？

鮮明で高解像度のスキャンでは、通常90〜98%の精度が得られます。

100ページのPDFが1秒で終わることがあるのはなぜですか？

PDFに既に選択可能なテキストレイヤーがある場合（ネイティブPDFで、スキャンではない場合）、OCRを実行せずにテキストを直接抽出します。テキストレイヤーのないスキャン済みPDFの場合は、全ページに対してOCRが実行されます。