Skip to content
LlamaPDFLlamaPDF
📝

Зургаас Текст

OCR ашиглан зургаас текст гаргаж авах

Сүүлд шинэчилсэн:

OCR (Optical Character Recognition) нь зураг, скан хийсэн баримтуудаас уншиж болох текстийг гаргаж авдаг. LlamaPDF нь таны хөтөч дотор бүхэлд нь ажилладаг Tesseract.js ашиглан 100+ хэл дээрх текстийг таньдаг. JPEG, PNG, WebP, BMP оролтыг автомат хэл илрүүлэлттэй дэмждэг.

Файлаа энд чирж оруулна уу

эсвэл дарж сонгоно уу

.JPG.JPEG.PNG.WEBP.BMP.TIFF.GIF

Дээд тал нь 50 МБ · Бүртгэл шаардахгүй

Таны файл төхөөрөмж дээр хэвээр байна — хэзээ ч байршуулахгүй

Зургаас текст хэрхэн гаргаж авах вэ

  1. 1

    Зургаа дээрх хайрцагт чирж оруулах эсвэл товшиж сонгоно уу. Дэмжигдсэн форматуудад PNG, JPG, WebP, BMP, TIFF орно.

  2. 2

    Зургаа урьдчилан харж, текст гаргаж авахыг хүссэн хэсгийг баталгаажуулна уу. Хэрэгсэл нь бүх зурган дахь текстийн бүсийг автоматаар илрүүлдэг.

  3. 3

    Текст гаргаж авах товч дарж, үр дүн шууд гарч ирнэ. Гаргаж авсан текстийг санах ойд хуулах эсвэл энгийн текст файл болгон татаж авах боломжтой. Бүх боловсруулалт таны браузерт явагддаг — зураг хэзээ ч таны төхөөрөмжийг орхидоггүй.

Яагаад манай зургаас текст гаргагчийг ашиглах вэ?

Зургаас текст гаргаж авах нь өдөр тутмын хамгийн нийтлэг ажлуудын нэг — дэлгэцийн зургаас иш татах, нэрийн хуудас дижитализаций хийх, самбарын зургийн өгөгдлийг авах, эсвэл скан хийсэн баримтыг засварлах боломжтой текст болгон хөрвүүлэх. Бүх зүйлийг гараар дахин бичих нь удаан бөгөөд алдаатай — анхааралтай бичлэг ч гэсэн алдаа гаргадаг. Манай зургаас текст хэрэгсэл нь оптик тэмдэгт таних технологи ашиглан хэвлэмэл болон гар бичмэл текстийг зургаас шууд уншиж, секундэд хуулахад бэлэн цэвэр гаралт өгдөг. Олон хэлийг зохицуулдаг бөгөөд тод дэлгэцийн зургаас баримтын арай налуу гэрэл зургийг хүртэл найдвартай ажилладаг. Лекцийн слайдыг авч буй оюутнуудад, хэвлэмэл тайлангийн өгөгдлийг гаргаж авч буй мэргэжилтнүүдэд болон тусгай программ суулгалгүйгээр харааны мэдээллийг хайлт хийгдэх, засварлах боломжтой текст болгон хувиргахыг хүссэн хэн бүхэнд онцгой үнэтэй.

Хэрэгсэл нь бүхэлдээ таны браузерт ажилладаг тул зургууд хувийн хэвээр байж, серверт хэзээ ч байршуулагддаггүй. Бүртгэл байхгүй, усан тэмдэггүй, боловсруулж болох зургийн тоонд хязгаар байхгүй. Энэхүү нууцлал-эхлэлтэй хандлага нь эмнэлгийн маягт, таних баримт бичиг, нууцлалтай бизнесийн материал зэрэг эмзэг баримт бичгийн текстийг аюулгүй гаргаж авах боломжийг олгодог. Бүтэн PDF баримтаас текст гаргаж авах шаардлагатай юу? Манай PDF-д зориулсан OCR хэрэгсэл-ийг туршаарай. Текст гаргаж авахаасаа өмнө зургийн форматыг хөрвүүлэх шаардлагатай бол зургуудын хооронд хөрвүүлэх, эсвэл бусад зориулалтаар тохируулахын тулд зургийн хэмжээ өөрчлөх боломжтой.

Түгээмэл Асуултууд

OCR-д ямар зургийн форматуудыг дэмждэг вэ?

JPG, PNG, WebP, BMP болон ихэнх нийтлэг зургийн форматуудыг дэмждэг.

Текст гаргаж авах нарийвчлал хэр байдаг вэ?

Нарийвчлал нь зургийн чанараас хамаарна. Тодорхой, өндөр нарийвчлалтай зургууд ихэвчлэн 95%+ нарийвчлалд хүрдэг.

Гар бичмэл текстийг дэмждэг үү?

Тийм. AI-д суурилсан OCR гар бичмэлийг таниж чадна, гэхдээ хэвлэмэл текст илүү өндөр нарийвчлал өгдөг.

Ямар хэлүүдийг дэмждэг вэ?

Tesseract.js-ээр дамжуулан 100 гаруй хэл дэмжигдэнэ; загварууд CDN-ээс шаардлагатай үед ачаалагдана. Автомат танилт эхний англи хэлний гаралтыг шалгаж, шаардлагатай бол илүү тохирох загварт шилжинэ. Холимог хэлтэй баримтын хувьд 3 хэл хүртэл нэгтгэж болно.

Зургийг серверт байршуулдаг уу?

Үгүй. OCR боловсруулалт хөтөч дотор бүрэн явагдана. Зургууд хэзээ ч төхөөрөмжөөс гардаггүй.

Холбогдох Хэрэгслүүд