Skip to content
LlamaPDFLlamaPDF
🔍

PDF থেকে টেক্সট (OCR)

স্ক্যান করা PDF থেকে টেক্সট বের করুন

সর্বশেষ আপডেট:

OCR ছবি এবং PDF থেকে টেক্সট নিষ্কাশন করে। LlamaPDF প্রথমে পরীক্ষা করে PDF-এ ইতিমধ্যে একটি নির্বাচনযোগ্য টেক্সট স্তর রয়েছে কিনা এবং সরাসরি তা কপি করে — দ্রুত এবং লসলেস। যদি না থাকে (বা ছবির জন্য), এটি Tesseract.js-এ ফিরে যায় যা সম্পূর্ণভাবে আপনার ব্রাউজারে চলে, ঐচ্ছিক স্বয়ংক্রিয় সনাক্তকরণ সহ 100+ ভাষা সমর্থন করে।

আপনার ফাইল এখানে টেনে এনে ছাড়ুন

অথবা ফাইল নির্বাচন করুন

.PDF.JPG.PNG.WEBP

সর্বোচ্চ ৫০ MB · নিবন্ধনের প্রয়োজন নেই

আপনার ফাইল আপনার ডিভাইসেই থাকে — কখনও আপলোড হয় না

OCR দিয়ে PDF বা ছবি থেকে টেক্সট বের করার পদ্ধতি

  1. 1

    আপনার স্ক্যান করা PDF বা ইমেজ ফাইল উপরের বক্সে ড্র্যাগ করে বা ব্রাউজ করে আপলোড করুন। PDF, PNG, JPG, TIFF, BMP এবং WebP সমর্থিত।

  2. 2

    সর্বোত্তম স্বীকৃতির নির্ভুলতার জন্য ডকুমেন্টের টেক্সটের ভাষা বেছে নিন।

  3. 3

    Extract Text ক্লিক করুন। বের করা টেক্সট পর্যালোচনা করুন এবং কপি করুন, বা টেক্সট ফাইল ডাউনলোড করুন। সব OCR প্রক্রিয়াকরণ সরাসরি আপনার ব্রাউজারে হয়।

আমাদের OCR টুল কেন ব্যবহার করবেন?

স্ক্যান করা ডকুমেন্ট, ফটো তোলা পৃষ্ঠা এবং ছবি-ভিত্তিক PDF ছবির ভেতরে মূল্যবান টেক্সট আটকে রাখে। সেই কন্টেন্ট অনুসন্ধান, কপি, সম্পাদনা বা পুনর্ব্যবহার করতে আগে মেশিন-পাঠযোগ্য টেক্সটে রূপান্তর করতে হবে। আমাদের OCR টুল ডকুমেন্টের ভিজ্যুয়াল কাঠামো বিশ্লেষণ করে উচ্চ নির্ভুলতায় প্রতিটি শব্দ বের করে।

পুরো প্রক্রিয়া আপনার ব্রাউজারে মক করে বলে সংবেদনশীল ডকুমেন্ট কখনো আপনার ডিভাইস ছাড়ে না। সাধারণ কাজের জন্য ইমেজ-টু-টেক্সট টুল ব্যবহার করুন। বের করা টেক্সটকে টেক্সট থেকে PDF কনভার্টার দিয়ে ডকুমেন্টে রূপান্তর করুন।

OCR কী?

OCR (Optical Character Recognition) হল একটি প্রযুক্তি যা টেক্সটের ছবি — স্ক্যান করা ডকুমেন্ট, ফটোগ্রাফ বা ছবি-ভিত্তিক PDF থেকে — মেশিন-পাঠযোগ্য, সম্পাদনাযোগ্য টেক্সটে রূপান্তর করে। OCR ইঞ্জিন ছবিতে অক্ষরের আকৃতি, নিদর্শন ও স্থানিক সম্পর্ক বিশ্লেষণ করে বর্ণ, সংখ্যা ও প্রতীক চিহ্নিত করে।

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

OCR কোন ভাষাগুলো সমর্থন করে?

Tesseract.js-এর মাধ্যমে ১০০-এর বেশি ভাষা। ড্রপডাউন থেকে যেকোনো ভাষা বাছুন, অথবা মিশ্র-ভাষার ডকুমেন্টের জন্য ৩টি পর্যন্ত একসাথে জোড়া দিন।

টেক্সট নিষ্কাশন কতটা নির্ভুল?

স্পষ্ট, উচ্চ-রেজোলিউশন স্ক্যান সাধারণত ৯০-৯৮% নির্ভুলতা অর্জন করে।

১০০-পৃষ্ঠার PDF কখনো কখনো এক সেকেন্ডে কেন শেষ হয়?

যদি PDF-এ ইতিমধ্যেই সিলেক্টেবল টেক্সট লেয়ার থাকে (নেটিভ, স্ক্যান নয়), তাহলে OCR চালানোর বদলে টেক্সট সরাসরি বের করা হয়। টেক্সট লেয়ার নেই এমন স্ক্যান করা PDF-এ প্রতিটি পৃষ্ঠায় পূর্ণ OCR চলে।

সম্পর্কিত টুলস