Skip to content
LlamaPDFLlamaPDF
🔍

PDF سے متن (OCR)

اسکین شدہ PDFs سے متن نکالیں

آخری تازہ کاری:

OCR تصاویر اور PDFs سے متن نکالتا ہے۔ LlamaPDF پہلے چیک کرتا ہے کہ آیا PDF میں پہلے سے قابل انتخاب متن کی پرت موجود ہے اور اسے براہ راست کاپی کرتا ہے — تیز اور بغیر نقصان کے۔ اگر نہیں (یا تصاویر کے لیے)، تو یہ Tesseract.js پر واپس آتا ہے جو مکمل طور پر آپ کے براؤزر میں چلتا ہے، 100+ زبانوں کو اختیاری خودکار شناخت کے ساتھ سپورٹ کرتا ہے۔

اپنی فائل یہاں ڈریگ اور ڈراپ کریں

یا منتخب کرنے کے لیے کلک کریں

.PDF.JPG.PNG.WEBP

زیادہ سے زیادہ 50 MB · رجسٹریشن کی ضرورت نہیں

آپ کی فائل آپ کے آلے پر رہتی ہے — کبھی اپ لوڈ نہیں ہوتی

OCR سے PDF یا تصویر سے متن نکالنے کا طریقہ

  1. 1

    اپنی سکین شدہ PDF یا تصویری فائل اوپر والے خانے میں ڈریگ کر کے یا براؤز کر کے اپلوڈ کریں۔ PDF، PNG، JPG، TIFF، BMP، اور WebP معاون ہیں۔

  2. 2

    بہترین شناخت کی درستگی کے لیے اپنی دستاویز میں متن کی زبان منتخب کریں۔ کئی زبانوں والی دستاویزات کے لیے تمام متعلقہ زبانیں منتخب کریں۔

  3. 3

    Extract Text پر کلک کریں۔ نکالے گئے متن کا جائزہ لیں اور کاپی کریں، یا ٹیکسٹ فائل ڈاؤن لوڈ کریں۔ تمام OCR پروسیسنگ براہ راست آپ کے براؤزر میں ہوتی ہے — آپ کی دستاویزات کبھی کسی سرور پر اپلوڈ نہیں ہوتیں۔

ہماری OCR ٹول کیوں استعمال کریں؟

سکین شدہ دستاویزات، فوٹو شدہ صفحات، اور تصویر پر مبنی PDFs قیمتی متن کو تصویروں کے اندر بند رکھتی ہیں۔ آپ اس مواد کو تلاش، کاپی، ترمیم، یا دوبارہ استعمال نہیں کر سکتے بغیر پہلے اسے مشین ریڈ ایبل متن میں تبدیل کیے۔ ہماری OCR ٹول آپ کی دستاویز کے بصری ڈھانچے کا تجزیہ کرتی ہے اور ہر لفظ کو اعلیٰ درستگی سے نکالتی ہے۔ یہ واحد صفحے کی رسیدوں سے لے کر کئی صفحات کے سکین شدہ معاہدوں تک سب سنبھالتی ہے۔

چونکہ پورا عمل مقامی طور پر آپ کے براؤزر میں ہوتا ہے، آپ کی حساس دستاویزات — قانونی معاہدے، طبی ریکارڈز، مالیاتی بیانات — آپ کا آلہ کبھی نہیں چھوڑتیں۔ سادہ کاموں کے لیے جیسے ایک فوٹو سے متن نکالنا، ہماری تصویر سے متن ٹول آسان تجربہ فراہم کرتی ہے۔ نکالے گئے متن کو متن سے PDF تبدیل کنندہ سے مناسب دستاویز میں تبدیل کریں۔

OCR کیا ہے؟

OCR (Optical Character Recognition) ایک ٹیکنالوجی ہے جو متن کی تصاویر — چاہے سکین شدہ دستاویزات سے ہوں، تصاویر سے، یا تصویر پر مبنی PDFs سے — کو مشین ریڈ ایبل، قابل ترمیم متن میں تبدیل کرتی ہے۔ OCR انجن تصویر میں حروف کی شکلوں، نمونوں، اور مکانی تعلقات کا تجزیہ کر کے حروف، نمبر، اور علامات شناخت کرتے ہیں۔ جدید OCR سینکڑوں زبانیں معاون رکھتا ہے اور مختلف فونٹس، سائز، اور لے آؤٹس سنبھال سکتا ہے۔

اکثر پوچھے جانے والے سوالات

OCR کون سی زبانیں سپورٹ کرتا ہے؟

Tesseract.js کے ذریعے 100 سے زائد زبانیں۔ ڈراپ ڈاؤن سے کوئی بھی زبان منتخب کریں، یا متعدد زبانوں کی دستاویزات کے لیے 3 تک زبانیں ملائیں۔

متن نکالنے کی درستگی کتنی ہے؟

واضح، اعلیٰ ریزولیوشن اسکینز عام طور پر 90-98% درستگی حاصل کرتی ہیں۔

100 صفحات والی PDF کے لیے یہ کبھی کبھی ایک سیکنڈ میں کیوں مکمل ہو جاتا ہے؟

اگر PDF میں پہلے سے قابلِ انتخاب ٹیکسٹ لیئر موجود ہو (ڈیجیٹل، اسکین شدہ نہیں)، تو متن OCR چلانے کے بجائے براہِ راست نکالا جاتا ہے۔ بغیر ٹیکسٹ لیئر والی اسکین شدہ PDFs کے لیے، ہر صفحے پر مکمل OCR چلایا جاتا ہے۔

متعلقہ ٹولز