Skip to content
LlamaPDFLlamaPDF
🔍

PDF hadi Maandishi (OCR)

Toa maandishi kutoka PDF zilizoscaniwa

Sasisho la mwisho:

OCR huchimba maandishi kutoka kwa picha na PDF. LlamaPDF kwanza huangalia ikiwa PDF tayari ina safu ya maandishi inayoweza kuchaguliwa na kuinakili moja kwa moja — haraka na bila hasara. Ikiwa sio (au kwa picha), inarudi kwa Tesseract.js inayoendesha kabisa ndani ya kivinjari chako, ikiunga mkono lugha 100+ na ugunduzi wa kiotomatiki wa hiari.

Buruta na uacha faili yako hapa

au bonyeza kuchagua

.PDF.JPG.PNG.WEBP

Kiwango cha juu 50 MB · Hakuna usajili unaohitajika

Faili yako inabaki kwenye kifaa chako — haijapakiwa

Jinsi ya Kutoa Maandishi kwa OCR

  1. 1

    Pakia picha au PDF iliyochapishwa.

  2. 2

    Chagua lugha ya maandishi.

  3. 3

    Bofya Endesha OCR na unakili maandishi yaliyotolewa.

Kwa Nini Kutumia OCR?

OCR (Optical Character Recognition) hutumika kutoa maandishi yanayoweza kuhaririwa kutoka nyaraka zilizochapishwa na picha.

Toa picha kutoka PDF au Kandamiza PDF.

OCR ni Nini?

OCR (Optical Character Recognition) ni teknolojia ya kubadilisha maandishi yaliyochapishwa au yaliyoandikwa kwa mkono kutoka picha na nyaraka zilizochapishwa kuwa umbizo linaloweza kusomwa na mashine.

Maswali Yanayoulizwa Mara kwa Mara

Je, OCR inasaidia lugha gani?

Zaidi ya lugha 100 kupitia Tesseract.js. Chagua lugha yoyote kutoka kwenye orodha, au changanya hadi 3 kwa hati zenye lugha mchanganyiko.

Je, utoaji wa maandishi ni sahihi kiasi gani?

Skanishi wazi na zenye uhalisia wa juu kwa kawaida hufikia usahihi wa 90–98%.

Kwa nini wakati mwingine inamaliza kwa sekunde moja kwa PDF ya kurasa 100?

Ikiwa PDF tayari ina safu ya maandishi inayoweza kuchaguliwa (ya asili, si iliyoscaniwa), maandishi yanatolewa moja kwa moja badala ya kuendesha OCR. Kwa PDF zilizoscaniwa zisizo na safu ya maandishi, OCR kamili inaendeshwa kwenye kila ukurasa.

Zana Zinazohusiana