Skip to content
LlamaPDFLlamaPDF
🔍

PDF szöveggé (OCR)

Szöveg kinyerése beolvasott PDF-ekből

Utoljára frissítve:

Az OCR szöveget nyer ki képekből és PDF-ekből. A LlamaPDF először ellenőrzi, hogy a PDF már tartalmaz-e kijelölhető szövegréteget, és azt közvetlenül átmásolja — gyorsan és veszteségmentesen. Ha nem (vagy képeknél), a Tesseract.js-re vált, amely teljes egészében a böngésződben fut, 100+ nyelv támogatásával és opcionális automatikus felismeréssel.

Húzd ide a fájlt

vagy kattints a kiválasztáshoz

.PDF.JPG.PNG.WEBP

Max 50 MB · Regisztráció nem szükséges

A fájlod az eszközödön marad — soha nem kerül feltöltésre

OCR használata PDF-en

  1. 1

    Tölts fel szkennelt PDF-et vagy képet.

  2. 2

    Válaszd ki a dokumentum nyelvét.

  3. 3

    Töltsd le a szerkeszthető PDF-et, vagy másold ki a szöveget.

Miért használj OCR-t a LlamaPDF-fel?

A szkennelt PDF-ekben nem lehet szöveget keresni vagy szerkeszteni. A LlamaPDF OCR (Optical Character Recognition) funkciója elemzi a képeket és kinyeri a szöveget — ideális régi dokumentumokhoz, nyugtákhoz és szerződésekhez.

Az OCR után tömörítheted, feloszthatod vagy megvédheted a fájlt.

Mi az OCR?

Az OCR (Optical Character Recognition) technológia szövegeket ismer fel és nyer ki képekből és szkennelt dokumentumokból. A nem szerkeszthető képtartalmat kereshető, másolható és szerkeszthető digitális szöveggé alakítja.

Gyakran Ismételt Kérdések

Milyen nyelveket támogat az OCR?

Több mint 100 nyelvet a Tesseract.js-en keresztül. Válassz bármelyiket a listából, vagy kombinálj akár 3-at vegyes nyelvű dokumentumokhoz.

Milyen pontos a szövegkinyerés?

A tiszta, nagy felbontású szkennelések általában 90-98%-os pontosságot érnek el.

Miért végez néha egy 100 oldalas PDF-fel egy másodperc alatt?

Ha a PDF már rendelkezik kijelölhető szövegréteggel (digitális, nem szkennelt), a szöveg közvetlenül kinyerésre kerül OCR futtatása nélkül. Szövegréteg nélküli szkennelt PDF-eknél minden oldalon teljes OCR fut.

Kapcsolódó eszközök