Skip to content
LlamaPDFLlamaPDF
🔍

PDF-dən Mətn (OCR)

Skan edilmiş PDF-lərdən mətn çıxarın

Son yenilənmə:

OCR şəkillərdən və PDF-lərdən mətn çıxarır. LlamaPDF əvvəlcə PDF-in artıq seçilə bilən mətn qatına malik olub-olmadığını yoxlayır və onu birbaşa kopyalayır — sürətli və itkisiz. Əgər yoxdursa (və ya şəkillər üçün), o, 100+ dili dəstəkləyən və isteğe bağlı avtomatik aşkarlama ilə tamamilə brauzerinizdə işləyən Tesseract.js-ə müraciət edir.

Faylınızı bura sürüşdürün

və ya seçmək üçün klikləyin

.PDF.JPG.PNG.WEBP

Maks 50 MB · Qeydiyyat tələb olunmur

Faylınız cihazınızda qalır — heç vaxt yüklənmir

PDF və ya şəkildən OCR ilə mətn necə çıxarılır

  1. 1

    Skan edilmiş PDF və ya şəkil faylınızı yuxarıdakı sahəyə sürüşdürün və ya klikləyib seçin. Alət PDF, PNG, JPG, TIFF, BMP və WebP formatlarını dəstəkləyir.

  2. 2

    Optimal tanıma dəqiqliyi üçün sənəddəki mətnin dilini seçin. Çoxdilli sənədlər üçün bütün tətbiq olunan dilləri seçin. OCR mühərriki sütunlar, cədvəllər və başlıqlar daxil olmaqla bütün sənəd strukturunu təhlil edəcəkdir.

  3. 3

    Sənədinizə optik simvol tanıma tətbiq etmək üçün Mətn Çıxar düyməsinə basın. Çıxarılmış mətni nəzərdən keçirin, kopyalayın və ya mətn faylı kimi yükləyin. Bütün OCR emalı bilavasitə brauzerinizdə qabaqcıl tanıma alqoritmləri istifadə edərək işləyir — sənədləriniz heç bir serverə yüklənmir, tam məxfilik təmin olunur.

Niyə OCR alətimizi istifadə etməlisiniz?

Skan edilmiş sənədlər, fotoşəkillər və şəkil əsaslı PDF-lər dəyərli mətni şəkillər içindəki kilidləyir. Bu məzmunu axtarmaq, kopyalamaq, redaktə etmək və ya yenidən istifadə etmək üçün əvvəlcə onu maşın tərəfindən oxunaqlı mətnə çevirmək lazımdır. OCR alətimiz bunu sənədinizin vizual strukturunu təhlil etmək və hər sözü yüksək dəqiqliklə çıxarmaqla həll edir. Tək səhifəlik qəbzlərdən çoxsəhifəli skan edilmiş müqavilələrə və akademik məqalələrə qədər — çoxsütunlu səhifələr və cədvəllər daxil olmaqla mürəkkəb düzümlərin oxuma sırasını qoruyaraq onlarla dildə çap edilmiş mətni tanıyır. Tamamilə pulsuzdur, istənilən cihazda işləyir, qeydiyyat tələb olunmur. Nəticə anında hazırdır — surəti çıxarın, redaktə edin, ya da fayl kimi yükləyin. Skan edilmiş sənədlərlə işləyən hər kəs üçün — hüquqşünaslar, mühasiblər, müəllimlər, tədqiqatçılar — bu alət misilsiz vaxt qənaətidir.

Bütün proses brauzerinizdə yerli olaraq işlədiyi üçün həssas sənədləriniz — hüquqi müqavilələr, tibbi qeydlər, maliyyə hesabatları — cihazınızı tərk etmir. Yükləmə yoxdur, bulud emalı yoxdur, üçüncü tərəf girişi yoxdur. Tək bir foto və ya ekran görüntüsündən mətn çıxarmaq kimi daha sadə tapşırıqlar üçün şəkildən mətn alətimiz sadələşdirilmiş təcrübə təqdim edir. Çıxarılmış mətni əldə etdikdən sonra mətndən PDF çeviricisi ilə düzgün sənədə çevirin, orijinal PDF-i birbaşa redaktə edin və ya skan edilmiş cədvəllərlə işləmək lazımdırsa, mətni çıxarıb JSON-CSV çeviricisindən istifadə edərək məlumatlarınızı strukturlaşdırın.

OCR nədir?

OCR (Optical Character Recognition — Optik Simvol Tanıma), şəkillərdəki mətni — skan edilmiş sənədlərdən, fotoşəkillərdən və ya şəkil əsaslı PDF-lərdən — maşın tərəfindən oxunaqlı, redaktə edilə bilən mətnə çevirən texnologiyadır. OCR mühərrici hərfləri, rəqəmləri və simvolları müəyyənləşdirmək üçün şəkildəki simvolların forma, naxış və məkan əlaqələrini təhlil edir. Müasir OCR yüzlərlə dili dəstəkləyir və müxtəlif şrift, ölçü və düzümləri emal edə bilir. Sənəd rəqimsallaşdırılması, axtarıla bilən PDF yaradılması, avtomatlaşdırılmış məlumat girişi və çap edilmiş mətni yüksək səslə oxuyan əlçatanlıq alətlərinin əsas texnologiyasıdır.

Tez-tez Verilən Suallar

OCR hansı dilləri dəstəkləyir?

Tesseract.js vasitəsilə 100-dən çox dil. Açılan menyudan istədiyiniz dili seçin və ya qarışıq dilli sənədlər üçün 3 dilə qədər birləşdirin.

Mətn çıxarma nə qədər dəqiqdir?

Aydın, yüksək çözünürlüklü skanlar adətən 90-98% dəqiqlik əldə edir.

100 səhifəlik PDF niyə bəzən bir saniyədə bitir?

PDF-də artıq seçilə bilən mətn qatı varsa (skan edilməmiş, rəqəmsal), mətn OCR işlədilmədən birbaşa həmin qatdan oxunur. Mətn qatı olmayan skan PDF-lərdə isə hər səhifəyə tam OCR tətbiq olunur.

Əlaqəli Alətlər