Skip to content
LlamaPDFLlamaPDF
🔍

PDF இலிருந்து உரை (OCR)

ஸ்கேன் செய்யப்பட்ட PDF களிலிருந்து உரை பிரித்தெடு

கடைசியாக புதுப்பிக்கப்பட்டது:

OCR படங்கள் மற்றும் PDF-களிலிருந்து உரையைப் பிரித்தெடுக்கிறது. LlamaPDF முதலில் PDF-இல் ஏற்கனவே தேர்ந்தெடுக்கக்கூடிய உரை அடுக்கு உள்ளதா என்பதைச் சரிபார்த்து அதை நேரடியாக நகலெடுக்கிறது — வேகமாகவும் நஷ்டமில்லாமலும். இல்லையென்றால் (அல்லது படங்களுக்கு), அது Tesseract.js-க்கு திரும்பச் செல்கிறது, இது முழுவதுமாக உங்கள் உலாவியில் இயங்குகிறது, விருப்பத்தேர்வு தானியங்கி-கண்டறிதலுடன் 100+ மொழிகளை ஆதரிக்கிறது.

உங்கள் கோப்பை இங்கே இழுத்து விடுங்கள்

அல்லது தேர்வு செய்ய கிளிக் செய்யுங்கள்

.PDF.JPG.PNG.WEBP

அதிகபட்சம் 50 MB · பதிவு தேவையில்லை

உங்கள் கோப்பு உங்கள் சாதனத்திலேயே இருக்கும் — பதிவேற்றப்படுவதில்லை

PDF-ல் OCR பயன்படுத்துவது எப்படி

  1. 1

    ஸ்கேன் செய்த PDF அல்லது படத்தை பதிவேற்றவும்.

  2. 2

    ஆவண மொழியை தேர்ந்தெடுக்கவும்.

  3. 3

    திருத்தக்கூடிய PDF-ஐ பதிவிறக்கவும் அல்லது உரையை நகலெடுக்கவும்.

LlamaPDF-ல் OCR பயன்படுத்துவது ஏன்?

ஸ்கேன் செய்த PDF-களில் உரையை தேட அல்லது திருத்த முடியாது. LlamaPDF-ன் OCR (Optical Character Recognition) படங்களை பகுப்பாய்வு செய்து உரையை பிரிக்கிறது — பழைய ஆவணங்கள், ரசீதுகள் மற்றும் ஒப்பந்தங்களுக்கு ஏற்றது.

OCR-க்கு பிறகு சுருக்கலாம், பிரிக்கலாம் அல்லது பாதுகாக்கலாம்.

OCR என்றால் என்ன?

OCR (Optical Character Recognition) என்பது படங்கள் மற்றும் ஸ்கேன் செய்த ஆவணங்களிலிருந்து உரையை அடையாளம் கண்டு பிரிக்கும் தொழில்நுட்பம். திருத்த முடியாத படத்தை தேட, நகலெடுக்க மற்றும் திருத்தக்கூடிய டிஜிட்டல் உரையாக மாற்றுகிறது.

அடிக்கடி கேட்கப்படும் கேள்விகள்

OCR எந்த மொழிகளை ஆதரிக்கிறது?

Tesseract.js மூலம் 100+ மொழிகள். கீழ்த்தோன்றும் மெனுவிலிருந்து எந்த மொழியையும் தேர்ந்தெடுக்கவும், அல்லது கலப்பு-மொழி ஆவணங்களுக்கு 3 மொழிகள் வரை ஒன்றாக சேர்க்கவும்.

உரை பிரித்தெடுப்பு எவ்வளவு துல்லியமானது?

தெளிவான, உயர் தெளிவுத்திறன் scans பொதுவாக 90-98% துல்லியத்தை அடையும்.

சில நேரம் 100 பக்க PDF ஒரே வினாடியில் ஏன் முடிகிறது?

PDF இல் ஏற்கனவே தேர்வு செய்யக்கூடிய டெக்ஸ்ட் லேயர் இருந்தால் (நேட்டிவ், ஸ்கேன் அல்ல), OCR இயக்குவதற்கு பதிலாக உரை நேரடியாக பிரித்தெடுக்கப்படுகிறது. டெக்ஸ்ட் லேயர் இல்லாத ஸ்கேன் செய்யப்பட்ட PDF களுக்கு ஒவ்வொரு பக்கத்திலும் முழு OCR இயங்கும்.

தொடர்புடைய கருவிகள்