Skip to content
LlamaPDFLlamaPDF
🔍

PDF sa Teksto (OCR)

I-extract ang teksto mula sa mga na-scan na PDF

Huling na-update:

Ang OCR ay kumukuha ng teksto mula sa mga larawan at PDF. Una, sinusuri ng LlamaPDF kung naglalaman na ang PDF ng napipiling text layer at direktang kinokopya ito — mabilis at walang pagkawala. Kung hindi (o para sa mga larawan), bumabalik ito sa Tesseract.js na tumatakbo nang buo sa iyong browser, na sumusuporta sa 100+ na wika na may opsyonal na auto-detection.

I-drag at i-drop ang iyong file dito

o mag-click upang pumili

.PDF.JPG.PNG.WEBP

Max 50 MB · Hindi kailangan ng pagpaparehistro

Nananatili ang iyong file sa iyong device — hindi ina-upload

Paano gamitin ang OCR para basahin ang teksto mula sa larawan

  1. 1

    Mag-upload ng larawan o PDF na may teksto

  2. 2

    Pumili ng wika ng teksto sa dokumento

  3. 3

    I-click ang 'Basahin ang Teksto' at kopyahin o i-download ang resulta

Bakit gamitin ang OCR ng LlamaPDF

Ang advanced na OCR technology ng LlamaPDF ay nag-co-convert ng mga larawan at scanned na PDF sa maaaring i-edit na teksto, sumusuporta ng maraming wika kasama ang Filipino. Libre, mabilis, gumagana sa browser.

Pagkatapos i-extract ang teksto, mag-convert ng teksto sa PDF o mag-edit ng PDF agad.

Ano ang OCR?

Ang OCR (Optical Character Recognition) ay isang teknolohiya na nag-co-convert ng mga larawan ng teksto sa digital data na maaaring i-edit at hanapin. Ginagamit sa pag-digitize ng dokumento, pag-scan, at pag-proseso ng mga larawang may teksto.

Mga Madalas Itanong

Anong mga wika ang sinusuportahan ng OCR?

Mahigit 100 wika sa pamamagitan ng Tesseract.js. Pumili ng anumang wika mula sa dropdown, o pagsamahin hanggang 3 para sa mga dokumentong may halong wika.

Gaano katumpak ang pag-extract ng teksto?

Ang malinaw, mataas na resolusyon na mga scan ay karaniwang nakakamit ng 90–98% na katumpakan.

Bakit minsan natatapos ito sa isang segundo para sa 100-pahinang PDF?

Kung ang PDF ay mayroon nang selectable text layer (native, hindi scanned), direktang ine-extract ang teksto sa halip na patakbuhin ang OCR. Para sa mga scanned PDF na walang text layer, buong OCR ang tumatakbo sa bawat pahina.

Mga Kaugnay na Kagamitan