Skip to content
LlamaPDFLlamaPDF
🔍

PDF-den Tekst (OCR)

Skaner edilen PDF-lerden tekst çykar

Soňky täzelenme:

OCR şekillerden we PDF-lerden tekst çykarýar. LlamaPDF ilki bilen PDF-iň eýýäm saýlanyp bilinýän tekst gatlagy bar bolup-bolmandygyny barlaýar we ony göni göçürýär — çalt we ýitgisiz. Eger ýok bolsa (ýa-da şekiller üçin), 100+ dili goldaýan, isleg boýunça awtomat ýüze çykarmaly Tesseract.js-e siziň brauzeriňizde doly işleýär.

Faýlyňyzy şu ýere süýräp taşlaň

ýa-da saýlamak üçin basyň

.PDF.JPG.PNG.WEBP

Iň köp 50 MB · Hasaba alynmak hökman däl

Faýlyňyz enjamyňyzda galýar — hiç ýere ýüklenmeýär

Suratdan ýa-da PDF-den tekst nädip çykarylýar

  1. 1

    Surat (PNG, JPG, HEIC we ş.m.) ýa-da PDF faýly ýükläň.

  2. 2

    OCR tehnologiýasy suratdaky teksti awtomatik anyklar we çykarar.

  3. 3

    Çykarylan teksti göçürip alyň ýa-da faýl hökmünde ýükläp alyň.

Näme üçin OCR üçin LlamaPDF iň gowy saýlaw?

OCR (Optical Character Recognition) — optiki simwol tanamak tehnologiýasy bolup, surat ýa-da PDF-däki teksti redaktirlenip bilinjek formata öwürmäge mümkinçilik berýär. LlamaPDF bu işi mugt we hiç hili programma gurnamazdan ýerine ýetirýär. Hasaba alynmak hökman däl — diňe faýly ýükläň we netijäni birnäçe sekuntda alyň. Maglumatlar brauzeriňizde galýar: ähli işler şifrli baglanyşyk arkaly howpsuz ýerine ýetirilýär we öwrülenden soň derrew pozulýar. Bu täjirçilik OCR programmalarynyň arzan we amatly alternatiwasydyr. Islendik enjamda — kompýuterde, planşetde ýa-da telefonçada — ajaýyp işleýär.

LlamaPDF resminamalary birnäçe dilde — şol sanda türkmen, rus we iňlis dillerinde — işleýär. Netije birnäçe sekuntda taýýar bolýar we teksti göni brauzerde redaktirläp ýa-da göçürip almak mümkin. Bu kagyz resminamalary — şertnamalar, kitaplar, gazetalar — sanlylaşdyrmak üçin örän amatlydyr. Skanerlenen resminamanyň hili pes bolsa-da, döwrebap OCR tehnologiýasy emeli aňyň kömegi bilen teksti takyk tanýar. Şahsy suratlary tekst resminamasyna öwürmek üçin suratdan tekst almak guralyňy hem görüň. Teksti PDF-de saklamak üçin tekstden PDF hyzmatyny ulanyň. PDF faýlyň mazmunyny redaktirlemek gerekse, PDF redaktirlemek guralyňa geçiň. Maglumatlary gurluşly formata geçirmek üçin JSON-den CSV hyzmatyny hem göz öňünde tutuň.

OCR näme we ol nädip işleýär?

OCR (Optical Character Recognition) — kompýutere suratdaky simwollary we sözleri tanap bilmäge mümkinçilik berýän tehnologiýa. Ol resminamalary skanirlemekde, kitaphanalary sanlylaşdyrmakda we iş proseslerini awtomatlaşdyrmakda giňden ulanylýar. Ozal OCR üçin gymmat ýörite programmalar gerekdi, ýöne şu gün LlamaPDF muny mugt we brauzerde hödürleýär. Döwrebap OCR tehnologiýasy emeli aňdan peýdalanyp, hili pes suratlardan hem teksti takyk tanýar. El ýazgysy ýa-da çap edilen tekstler, sanlar, tablisalar — ählisi OCR tarapyndan üstünlikli işlenip bilinýär.

Köp Soralýan Soraglar

OCR haýsy dilleri goldaýar?

Tesseract.js arkaly 100-den gowrak dil. Açylýan menýudan islendik dili saýlaň ýa-da garyşyk dilli resminamalar üçin 3 dile çenli birleşdiriň.

Tekst çykarma takyklygy nähili?

Aýdyň, ýokary çözünirlikli skanlar adatça 90-98% takyklyk gazanýar.

100 sahyply PDF käwagt näme üçin bir sekuntda gutarýar?

PDF-de öňünden saýlanyp bolýan tekst gatlagy bar bolsa (sanly, skaner edilmedik), tekst OCR işledilmän, göni şol gatlakdan okalýar. Tekst gatlagy bolmaýan skaner PDF-ler üçin her sahypa doly OCR ulanylýar.

Baglanyşykly Gurallar