Skip to content
LlamaPDFLlamaPDF
🔍

PDF ба Матн (OCR)

Матнро аз PDF-ҳои скансшуда берун кашед

Навсозии охирин:

OCR матнро аз тасвирҳо ва PDF-ҳо истихроҷ мекунад. LlamaPDF аввал тафтиш мекунад, ки оё PDF аллакай қабати матни интихобшаванда дорад ва онро мустақиман нусхабардорӣ мекунад — тез ва бе талаф. Агар не (ё барои тасвирҳо), он ба Tesseract.js баргардад, ки пурра дар браузери шумо иҷро мешавад, бо дастгирии 100+ забон бо ошкоркунии худкори ихтиёрӣ.

Файли худро ин ҷо кашед ва партоед

ё барои интихоб клик кунед

.PDF.JPG.PNG.WEBP

Ҳадди аксар 50 МБ · Бидуни қайднома

Файли шумо дар дастгоҳи шумо мемонад — ҳеҷ гоҳ бор карда намешавад

Чӣ тавр матнро аз тасвир ё PDF баровардан мумкин аст

  1. 1

    Тасвир (PNG, JPG, HEIC ва ғайра) ё файли PDF-ро бор кунед.

  2. 2

    Технологияи OCR матнро дар тасвир мешиносад ва истихроҷ мекунад.

  3. 3

    Матни дарёфтшударо нусхабардорӣ кунед ё ба файл зеркашӣ кунед.

Чаро LlamaPDF барои OCR беҳтарин аст

OCR — технологияи шинохти матни оптикӣ — ба шумо имкон медиҳад матни дар тасвир ё PDF буддаро ба матни қобили таҳрир табдил диҳед. LlamaPDF ин корро ройгон ва бидуни насби ягон барнома анҷом медиҳад. Барои истифодабарандагон дар Тоҷикистон ин хеле муҳим аст, зеро нармафзорҳои OCR-и тиҷоратӣ хеле гаронбаҳо ҳастанд.

LlamaPDF ҳуҷҷатҳоро дар забонҳои гуногун — аз ҷумла тоҷикӣ, русӣ ва англисӣ — коркард мекунад. Натиҷа дар чанд сония тайёр мешавад ва шумо метавонед матнро мустақиман дар браузер таҳрир кунед ё нусха гиред. Ин барои рақамикунонии ҳуҷҷатҳои коғазӣ — шартномаҳо, китобҳо, рӯзномаҳо — хеле муносиб аст. Барои вазифаҳои шабеҳ абзори истихроҷи матн аз тасвир-ро ҳам истифода баред. Инчунин PDF-ро метавон ба ёрии PDF ба JPG ба тасвир табдил дода сипас матнро баровард.

OCR чист ва чӣ тавр кор мекунад?

OCR (Optical Character Recognition) як технологияест, ки ба компютер имкон медиҳад аломатҳо ва калимаҳоро дар тасвир бишносад. Ин технология дар скannер кардани ҳуҷҷатҳо, рақамикунонии китобхонаҳо ва автоматикунонии коргузорӣ хеле маъмул аст. Дар гузашта OCR ба нармафзорҳои гаронбаҳо ниёз дошт, аммо имрӯз LlamaPDF онро ройгон ва дар браузер пешниҳод мекунад. Технологияи муосири OCR бо ёрии зеҳни сунъӣ дақиқии баланд дорад ва матнро дар тасвирҳои суратгирии бо сифати паст ҳам хуб мешиносад.

Саволҳои Зуд-Зуд Пурсидашаванда

OCR кадом забонҳоро дастгирӣ мекунад?

Зиёда аз 100 забон тавассути Tesseract.js. Аз рӯйхати афтанда ҳар забонро интихоб кунед, ё барои ҳуҷҷатҳои бисёрзабона то 3 забонро муттаҳид кунед.

Берун кашидани матн чӣ қадар дақиқ аст?

Скансҳои возеҳ ва баландсифат одатан дақиқии 90-98% ба даст меоранд.

Чаро баъзан барои PDF-и 100-саҳифа дар як сония анҷом меёбад?

Агар PDF аллакай қабати интихобшавандаи матн дошта бошад (рақамӣ, на скансшуда), матн ба ҷои иҷрои OCR мустақим берун кашида мешавад. Барои PDF-ҳои скансшуда, ки қабати матн надоранд, OCR-и пурра дар ҳар саҳифа иҷро мешавад.

Абзорҳои Марбут