Skip to content
LlamaPDFLlamaPDF
🔍

PDF నుండి టెక్స్ట్ (OCR)

స్కాన్ చేసిన PDF ల నుండి టెక్స్ట్ వెలికితీయి

చివరిగా నవీకరించబడింది:

OCR చిత్రాలు మరియు PDF-ల నుండి టెక్స్ట్‌ను సంగ్రహిస్తుంది. LlamaPDF మొదట PDF-లో ఇప్పటికే ఎంచుకోదగిన టెక్స్ట్ లేయర్ ఉందా అని తనిఖీ చేస్తుంది మరియు దానిని నేరుగా కాపీ చేస్తుంది — వేగంగా మరియు నష్టరహితంగా. లేకపోతే (లేదా చిత్రాల కోసం), ఇది Tesseract.js-కి తిరిగి వెళుతుంది, ఇది పూర్తిగా మీ బ్రౌజర్‌లో రన్ అవుతుంది, ఐచ్ఛిక స్వీయ-గుర్తింపుతో 100+ భాషలకు మద్దతు ఇస్తుంది.

మీ ఫైల్‌ను ఇక్కడ డ్రాగ్ & డ్రాప్ చేయండి

లేదా ఎంచుకోవడానికి క్లిక్ చేయండి

.PDF.JPG.PNG.WEBP

గరిష్టంగా 50 MB · నమోదు అవసరం లేదు

మీ ఫైల్ మీ పరికరంలోనే ఉంటుంది — ఎప్పుడూ అప్‌లోడ్ కాదు

OCR తో టెక్స్ట్ ఎలా వెలికితీయాలి

  1. 1

    ఇమేజ్ లేదా స్కాన్ అయిన PDF అప్‌లోడ్ చేయండి.

  2. 2

    టెక్స్ట్ భాషను ఎంచుకోండి.

  3. 3

    OCR రన్ చేయి క్లిక్ చేసి వెలికితీసిన టెక్స్ట్ కాపీ చేయండి.

OCR ఎందుకు?

OCR (Optical Character Recognition) స్కాన్ అయిన డాక్యుమెంట్‌లు మరియు ఇమేజ్‌ల నుండి ఎడిటబుల్ టెక్స్ట్ వెలికితీయడానికి ఉపయోగపడుతుంది.

PDF నుండి ఇమేజ్‌లు వెలికితీయండి లేదా PDF కంప్రెస్ చేయండి.

OCR అంటే ఏమిటి?

OCR (Optical Character Recognition) అనేది ఇమేజ్‌లు మరియు స్కాన్ అయిన డాక్యుమెంట్‌ల నుండి ప్రింటెడ్ లేదా హ్యాండ్‌రైటన్ టెక్స్ట్‌ను మెషిన్-రీడబుల్ ఫార్మాట్‌లో మార్చే సాంకేతికత.

తరచుగా అడిగే ప్రశ్నలు

OCR ఏ భాషలు సపోర్ట్ చేస్తుంది?

Tesseract.js ద్వారా 100కి పైగా భాషలు. డ్రాప్‌డౌన్ నుండి ఏ భాషనైనా ఎంచుకోండి, లేదా మిశ్రమ-భాష పత్రాల కోసం 3 వరకు కలపండి.

టెక్స్ట్ ఎక్స్‌ట్రాక్షన్ ఎంత ఖచ్చితంగా ఉంటుంది?

స్పష్టమైన, హై-రిజల్యూషన్ స్కాన్‌లు సాధారణంగా 90-98% ఖచ్చితత్వం సాధిస్తాయి.

కొన్నిసార్లు 100-పేజీల PDF ఒక్క సెకన్‌లో ఎందుకు పూర్తవుతుంది?

PDF లో ఇప్పటికే సెలెక్ట్ చేయగలిగే టెక్స్ట్ లేయర్ ఉంటే (నేటివ్, స్కాన్ కాదు), OCR నడపకుండా టెక్స్ట్ నేరుగా వెలికితీయబడుతుంది. టెక్స్ట్ లేయర్ లేని స్కాన్ చేసిన PDF లకు ప్రతి పేజీపై పూర్తి OCR నడుస్తుంది.

సంబంధిత టూల్స్