Skip to content
LlamaPDFLlamaPDF
📝

画像からテキスト

OCRで画像からテキストを抽出

最終更新:

OCR(光学文字認識)は、画像やスキャン文書から読み取り可能なテキストを抽出する技術です。LlamaPDFはTesseract.jsをブラウザ内で動作させ、100以上の言語に対応した文字認識を実現します。JPEG、PNG、WebP、BMP形式の入力と自動言語検出に対応しています。

ファイルをここにドラッグ&ドロップ

または クリックして選択

.JPG.JPEG.PNG.WEBP.BMP.TIFF.GIF

最大 50 MB · 登録不要

ファイルはデバイス上に留まります — アップロードされません

画像からテキストを抽出する方法

  1. 1

    LlamaPDFに画像またはPDFをアップロードします。

  2. 2

    OCRがテキストを認識します。

  3. 3

    抽出したテキストをコピーまたはダウンロードします。

画像からテキストを抽出する理由

スキャンした文書・スクリーンショット・写真に含まれるテキストを編集可能なデータにするために、LlamaPDFの画像→テキスト変換ツールをご利用ください。

多言語対応のOCR技術を無料で提供。スマートフォンからも利用できます。

よくある質問

OCRに対応している画像形式は何ですか?

JPG、PNG、WebP、BMP、その他一般的な画像形式に対応しています。

テキスト抽出の精度はどのくらいですか?

精度は画像の品質に依存します。鮮明で高解像度の画像では通常95%以上の精度が得られます。

手書き文字に対応していますか?

はい。AI駆動のOCRは手書き文字を認識できますが、印刷文字の方が高い精度を得られます。

対応している言語は何ですか?

Tesseract.js により100以上の言語に対応しており、CDNからオンデマンドで読み込まれます。自動検出は最初の英語パスを検査し、必要に応じてより適したモデルに切り替えます。複数言語が混在する文書向けに最大3言語を組み合わせることもできます。

画像はサーバーにアップロードされますか?

いいえ。OCR処理はすべてブラウザ内で行われます。画像がデバイスから出ることはありません。

関連ツール