Skip to content
LlamaPDFLlamaPDF
🔍

PDF ನಿಂದ ಪಠ್ಯ (OCR)

ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ PDF ಗಳಿಂದ ಪಠ್ಯ ಹೊರತೆಗೆಯಿರಿ

ಕೊನೆಯ ಬಾರಿ ನವೀಕರಿಸಲಾಗಿದೆ:

OCR ಚಿತ್ರಗಳು ಮತ್ತು PDF ಗಳಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯುತ್ತದೆ. LlamaPDF ಮೊದಲು PDF ಈಗಾಗಲೇ ಆಯ್ಕೆ ಮಾಡಬಹುದಾದ ಪಠ್ಯ ಪದರವನ್ನು ಹೊಂದಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ ಅದನ್ನು ನೇರವಾಗಿ ನಕಲಿಸುತ್ತದೆ — ವೇಗದ ಮತ್ತು ನಷ್ಟರಹಿತ. ಇಲ್ಲದಿದ್ದರೆ (ಅಥವಾ ಚಿತ್ರಗಳಿಗೆ), ಇದು Tesseract.js ಗೆ ಮರಳುತ್ತದೆ ಸಂಪೂರ್ಣವಾಗಿ ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ಚಲಿಸುತ್ತದೆ, ಐಚ್ಛಿಕ ಸ್ವಯಂ-ಪತ್ತೆಯೊಂದಿಗೆ 100+ ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.

ನಿಮ್ಮ ಫೈಲ್ ಅನ್ನು ಇಲ್ಲಿ ಎಳೆದು ಬಿಡಿ

ಅಥವಾ ಆಯ್ಕೆ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ

.PDF.JPG.PNG.WEBP

ಗರಿಷ್ಠ 50 MB · ನೋಂದಣಿ ಅಗತ್ಯವಿಲ್ಲ

ನಿಮ್ಮ ಫೈಲ್ ನಿಮ್ಮ ಸಾಧನದಲ್ಲೇ ಇರುತ್ತದೆ — ಎಂದಿಗೂ ಅಪ್‌ಲೋಡ್ ಆಗುವುದಿಲ್ಲ

OCR ಬಳಸಿ PDF ಅಥವಾ ಚಿತ್ರದಿಂದ ಪಠ್ಯ ಹೇಗೆ ಹೊರತೆಗೆಯುವುದು

  1. 1

    ನಿಮ್ಮ ಸ್ಕ್ಯಾನ್ ಆದ PDF ಅಥವಾ ಚಿತ್ರ ಫೈಲ್ ಮೇಲಿನ ಬಾಕ್ಸ್‌ಗೆ ಎಳೆದು ಬಿಡಿ ಅಥವಾ ಬ್ರೌಸ್ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ. PDF, PNG, JPG, TIFF, BMP, ಮತ್ತು WebP ಸ್ವರೂಪಗಳು ಬೆಂಬಲಿತ.

  2. 2

    ಉತ್ತಮ ಗುರುತಿಸುವಿಕೆ ನಿಖರತೆಗಾಗಿ ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿರುವ ಪಠ್ಯದ ಭಾಷೆ ಆಯ್ಕೆ ಮಾಡಿ. ಬಹು-ಭಾಷಾ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳಿಗೆ ಎಲ್ಲ ಅನ್ವಯಿಕ ಭಾಷೆಗಳನ್ನು ಆರಿಸಿ. OCR ಎಂಜಿನ್ ಕಾಲಮ್‌ಗಳು, ಟೇಬಲ್‌ಗಳು ಮತ್ತು ಹೆಡರ್‌ಗಳು ಸೇರಿದಂತೆ ಡಾಕ್ಯುಮೆಂಟ್ ರಚನೆ ವಿಶ್ಲೇಷಿಸುತ್ತದೆ.

  3. 3

    ಡಾಕ್ಯುಮೆಂಟ್‌ನಲ್ಲಿ ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ ಚಾಲಿಸಲು Extract Text ಕ್ಲಿಕ್ ಮಾಡಿ. ಹೊರತೆಗೆದ ಪಠ್ಯ ಪರಿಶೀಲಿಸಿ ಮತ್ತು ನಕಲಿಸಿ, ಅಥವಾ ಟೆಕ್ಸ್ಟ್ ಫೈಲ್ ಆಗಿ ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ. ಎಲ್ಲ OCR ಸಂಸ್ಕರಣೆ ನೇರವಾಗಿ ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ನಡೆಯುತ್ತದೆ — ನಿಮ್ಮ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು ಎಂದಿಗೂ ಯಾವ ಸರ್ವರ್‌ಗೂ ಅಪ್‌ಲೋಡ್ ಆಗುವುದಿಲ್ಲ.

ನಮ್ಮ OCR ಟೂಲ್ ಏಕೆ ಬಳಸಬೇಕು?

ಸ್ಕ್ಯಾನ್ ಆದ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು, ಫೋಟೋ ತೆಗೆದ ಪುಟಗಳು ಮತ್ತು ಚಿತ್ರ-ಆಧಾರಿತ PDF ಗಳು ಅಮೂಲ್ಯ ಪಠ್ಯವನ್ನು ಚಿತ್ರಗಳಲ್ಲಿ ಬಂದಿಸಿಟ್ಟಿವೆ. ಯಂತ್ರ-ಓದಬಹುದಾದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸದ ಹೊರತು ಹುಡುಕಲು, ನಕಲಿಸಲು, ಸಂಪಾದಿಸಲು ಅಥವಾ ಮರುಬಳಕೆ ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ನಮ್ಮ OCR ಟೂಲ್ ಏಕ-ಪುಟ ರಸೀದಿಗಳಿಂದ ಹಿಡಿದು ಬಹು-ಪುಟ ಸ್ಕ್ಯಾನ್ ಒಪ್ಪಂದಗಳವರೆಗೆ ಡಾಕ್ಯುಮೆಂಟ್‌ನ ದೃಶ್ಯ ರಚನೆ ವಿಶ್ಲೇಷಿಸಿ ಹೆಚ್ಚಿನ ನಿಖರತೆಯಿಂದ ಪ್ರತಿ ಪದ ಹೊರತೆಗೆಯುತ್ತದೆ. ಬಹು-ಕಾಲಮ್ ಪೇಜ್‌ಗಳು ಮತ್ತು ಟೇಬಲ್‌ಗಳ ಸಂಕೀರ್ಣ ಲೇಔಟ್‌ಗಳನ್ನೂ ಓದುವ ಕ್ರಮ ಉಳಿಸಿಕೊಂಡು ನಿಭಾಯಿಸುತ್ತದೆ.

ಇಡೀ ಪ್ರಕ್ರಿಯೆ ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ನಡೆಯುತ್ತದೆ — ಕಾನೂನು ಒಪ್ಪಂದಗಳು, ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು, ಹಣಕಾಸು ವ್ಯವಹಾರಗಳು — ನಿಮ್ಮ ಸಂವೇದನಾಶೀಲ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು ಎಂದಿಗೂ ಸಾಧನ ಬಿಡುವುದಿಲ್ಲ. ಅಪ್‌ಲೋಡ್ ಇಲ್ಲ, ಕ್ಲೌಡ್ ಸಂಸ್ಕರಣೆ ಇಲ್ಲ, ತೃತೀಯ-ಪಕ್ಷ ಪ್ರವೇಶ ಇಲ್ಲ. ಒಂದು ಫೋಟೋ ಅಥವಾ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ನಿಂದ ಪಠ್ಯ ಹೊರತೆಗೆಯಲು ಇಮೇಜ್-ಟು-ಟೆಕ್ಸ್ಟ್ ಟೂಲ್ ಸ್ಟ್ರೀಮ್‌ಲೈನ್ಡ್ ಅನುಭವ ನೀಡುತ್ತದೆ. ಸ್ಕ್ಯಾನ್ ಆದ PDF PDF ಆಗಿ ಇದ್ದರೆ ಮೊದಲು PDF ಟು JPG ಕನ್ವರ್ಟರ್ ಬಳಸಿ.

OCR ಎಂದರೇನು?

OCR (Optical Character Recognition) ಚಿತ್ರಗಳಲ್ಲಿರುವ ಪಠ್ಯ — ಸ್ಕ್ಯಾನ್ ಆದ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು, ಫೋಟೋಗಳು ಅಥವಾ ಚಿತ್ರ-ಆಧಾರಿತ PDF ಗಳು — ಯಂತ್ರ-ಓದಬಹುದಾದ, ಸಂಪಾದಿಸಬಹುದಾದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಜ್ಞಾನ. OCR ಎಂಜಿನ್‌ಗಳು ಚಿತ್ರದಲ್ಲಿ ಅಕ್ಷರಗಳ ಆಕಾರಗಳು, ಮಾದರಿಗಳು ಮತ್ತು ಪ್ರಾದೇಶಿಕ ಸಂಬಂಧಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿ ಅಕ್ಷರಗಳು, ಸಂಖ್ಯೆಗಳು ಮತ್ತು ಚಿಹ್ನೆಗಳನ್ನು ಗುರುತಿಸುತ್ತವೆ. ಆಧುನಿಕ OCR ನೂರಾರು ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಡಾಕ್ಯುಮೆಂಟ್ ಡಿಜಿಟಲೀಕರಣ, ಸರ್ಚ್ ಮಾಡಬಹುದಾದ PDF ರಚನೆ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾ ಎಂಟ್ರಿಯ ಮೂಲಭೂತ ತಂತ್ರಜ್ಞಾನ ಇದು.

ಪದೇ ಪದೇ ಕೇಳಲಾಗುವ ಪ್ರಶ್ನೆಗಳು

OCR ಯಾವ ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ?

Tesseract.js ಮೂಲಕ 100 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳು. ಡ್ರಾಪ್‌ಡೌನ್‌ನಿಂದ ಯಾವುದೇ ಭಾಷೆಯನ್ನು ಆಯ್ಕೆ ಮಾಡಿ, ಅಥವಾ ಮಿಶ್ರ-ಭಾಷಾ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳಿಗೆ 3 ಭಾಷೆಗಳವರೆಗೆ ಒಟ್ಟಿಗೆ ಸೇರಿಸಿ.

ಪಠ್ಯ ಹೊರತೆಗೆಯುವಿಕೆ ಎಷ್ಟು ನಿಖರ?

ಸ್ಪಷ್ಟ, ಹೆಚ್ಚಿನ-ರೆಸಲ್ಯೂಶನ್ ಸ್ಕ್ಯಾನ್‌ಗಳು ಸಾಮಾನ್ಯವಾಗಿ 90-98% ನಿಖರತೆ ಸಾಧಿಸುತ್ತವೆ.

ಕೆಲವೊಮ್ಮೆ 100-ಪುಟದ PDF ಒಂದೇ ಸೆಕೆಂಡಿನಲ್ಲಿ ಏಕೆ ಮುಗಿಯುತ್ತದೆ?

PDF ನಲ್ಲಿ ಈಗಾಗಲೇ ಆಯ್ಕೆ ಮಾಡಬಹುದಾದ ಪಠ್ಯ ಲೇಯರ್ ಇದ್ದರೆ (ನೇಟಿವ್, ಸ್ಕ್ಯಾನ್ ಅಲ್ಲ), OCR ಚಲಾಯಿಸುವ ಬದಲು ಪಠ್ಯವನ್ನು ನೇರವಾಗಿ ಹೊರತೆಗೆಯಲಾಗುತ್ತದೆ. ಪಠ್ಯ ಲೇಯರ್ ಇಲ್ಲದ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ PDF ಗಳಿಗೆ ಪ್ರತಿ ಪುಟದಲ್ಲೂ ಪೂರ್ಣ OCR ನಡೆಯುತ್ತದೆ.

ಸಂಬಂಧಿತ ಉಪಕರಣಗಳು