PDF ನಿಂದ ಪಠ್ಯ (OCR)
ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ PDF ಗಳಿಂದ ಪಠ್ಯ ಹೊರತೆಗೆಯಿರಿ
ಕೊನೆಯ ಬಾರಿ ನವೀಕರಿಸಲಾಗಿದೆ:OCR ಚಿತ್ರಗಳು ಮತ್ತು PDF ಗಳಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯುತ್ತದೆ. LlamaPDF ಮೊದಲು PDF ಈಗಾಗಲೇ ಆಯ್ಕೆ ಮಾಡಬಹುದಾದ ಪಠ್ಯ ಪದರವನ್ನು ಹೊಂದಿದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಿ ಅದನ್ನು ನೇರವಾಗಿ ನಕಲಿಸುತ್ತದೆ — ವೇಗದ ಮತ್ತು ನಷ್ಟರಹಿತ. ಇಲ್ಲದಿದ್ದರೆ (ಅಥವಾ ಚಿತ್ರಗಳಿಗೆ), ಇದು Tesseract.js ಗೆ ಮರಳುತ್ತದೆ ಸಂಪೂರ್ಣವಾಗಿ ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಚಲಿಸುತ್ತದೆ, ಐಚ್ಛಿಕ ಸ್ವಯಂ-ಪತ್ತೆಯೊಂದಿಗೆ 100+ ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.
ನಿಮ್ಮ ಫೈಲ್ ಅನ್ನು ಇಲ್ಲಿ ಎಳೆದು ಬಿಡಿ
ಅಥವಾ ಆಯ್ಕೆ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ
ಗರಿಷ್ಠ 50 MB · ನೋಂದಣಿ ಅಗತ್ಯವಿಲ್ಲ
ನಿಮ್ಮ ಫೈಲ್ ನಿಮ್ಮ ಸಾಧನದಲ್ಲೇ ಇರುತ್ತದೆ — ಎಂದಿಗೂ ಅಪ್ಲೋಡ್ ಆಗುವುದಿಲ್ಲ
OCR ಬಳಸಿ PDF ಅಥವಾ ಚಿತ್ರದಿಂದ ಪಠ್ಯ ಹೇಗೆ ಹೊರತೆಗೆಯುವುದು
- 1
ನಿಮ್ಮ ಸ್ಕ್ಯಾನ್ ಆದ PDF ಅಥವಾ ಚಿತ್ರ ಫೈಲ್ ಮೇಲಿನ ಬಾಕ್ಸ್ಗೆ ಎಳೆದು ಬಿಡಿ ಅಥವಾ ಬ್ರೌಸ್ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ. PDF, PNG, JPG, TIFF, BMP, ಮತ್ತು WebP ಸ್ವರೂಪಗಳು ಬೆಂಬಲಿತ.
- 2
ಉತ್ತಮ ಗುರುತಿಸುವಿಕೆ ನಿಖರತೆಗಾಗಿ ಡಾಕ್ಯುಮೆಂಟ್ನಲ್ಲಿರುವ ಪಠ್ಯದ ಭಾಷೆ ಆಯ್ಕೆ ಮಾಡಿ. ಬಹು-ಭಾಷಾ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಎಲ್ಲ ಅನ್ವಯಿಕ ಭಾಷೆಗಳನ್ನು ಆರಿಸಿ. OCR ಎಂಜಿನ್ ಕಾಲಮ್ಗಳು, ಟೇಬಲ್ಗಳು ಮತ್ತು ಹೆಡರ್ಗಳು ಸೇರಿದಂತೆ ಡಾಕ್ಯುಮೆಂಟ್ ರಚನೆ ವಿಶ್ಲೇಷಿಸುತ್ತದೆ.
- 3
ಡಾಕ್ಯುಮೆಂಟ್ನಲ್ಲಿ ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ ಚಾಲಿಸಲು Extract Text ಕ್ಲಿಕ್ ಮಾಡಿ. ಹೊರತೆಗೆದ ಪಠ್ಯ ಪರಿಶೀಲಿಸಿ ಮತ್ತು ನಕಲಿಸಿ, ಅಥವಾ ಟೆಕ್ಸ್ಟ್ ಫೈಲ್ ಆಗಿ ಡೌನ್ಲೋಡ್ ಮಾಡಿ. ಎಲ್ಲ OCR ಸಂಸ್ಕರಣೆ ನೇರವಾಗಿ ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ನಡೆಯುತ್ತದೆ — ನಿಮ್ಮ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಎಂದಿಗೂ ಯಾವ ಸರ್ವರ್ಗೂ ಅಪ್ಲೋಡ್ ಆಗುವುದಿಲ್ಲ.
ನಮ್ಮ OCR ಟೂಲ್ ಏಕೆ ಬಳಸಬೇಕು?
ಸ್ಕ್ಯಾನ್ ಆದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು, ಫೋಟೋ ತೆಗೆದ ಪುಟಗಳು ಮತ್ತು ಚಿತ್ರ-ಆಧಾರಿತ PDF ಗಳು ಅಮೂಲ್ಯ ಪಠ್ಯವನ್ನು ಚಿತ್ರಗಳಲ್ಲಿ ಬಂದಿಸಿಟ್ಟಿವೆ. ಯಂತ್ರ-ಓದಬಹುದಾದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸದ ಹೊರತು ಹುಡುಕಲು, ನಕಲಿಸಲು, ಸಂಪಾದಿಸಲು ಅಥವಾ ಮರುಬಳಕೆ ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ನಮ್ಮ OCR ಟೂಲ್ ಏಕ-ಪುಟ ರಸೀದಿಗಳಿಂದ ಹಿಡಿದು ಬಹು-ಪುಟ ಸ್ಕ್ಯಾನ್ ಒಪ್ಪಂದಗಳವರೆಗೆ ಡಾಕ್ಯುಮೆಂಟ್ನ ದೃಶ್ಯ ರಚನೆ ವಿಶ್ಲೇಷಿಸಿ ಹೆಚ್ಚಿನ ನಿಖರತೆಯಿಂದ ಪ್ರತಿ ಪದ ಹೊರತೆಗೆಯುತ್ತದೆ. ಬಹು-ಕಾಲಮ್ ಪೇಜ್ಗಳು ಮತ್ತು ಟೇಬಲ್ಗಳ ಸಂಕೀರ್ಣ ಲೇಔಟ್ಗಳನ್ನೂ ಓದುವ ಕ್ರಮ ಉಳಿಸಿಕೊಂಡು ನಿಭಾಯಿಸುತ್ತದೆ.
ಇಡೀ ಪ್ರಕ್ರಿಯೆ ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ನಡೆಯುತ್ತದೆ — ಕಾನೂನು ಒಪ್ಪಂದಗಳು, ವೈದ್ಯಕೀಯ ದಾಖಲೆಗಳು, ಹಣಕಾಸು ವ್ಯವಹಾರಗಳು — ನಿಮ್ಮ ಸಂವೇದನಾಶೀಲ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು ಎಂದಿಗೂ ಸಾಧನ ಬಿಡುವುದಿಲ್ಲ. ಅಪ್ಲೋಡ್ ಇಲ್ಲ, ಕ್ಲೌಡ್ ಸಂಸ್ಕರಣೆ ಇಲ್ಲ, ತೃತೀಯ-ಪಕ್ಷ ಪ್ರವೇಶ ಇಲ್ಲ. ಒಂದು ಫೋಟೋ ಅಥವಾ ಸ್ಕ್ರೀನ್ಶಾಟ್ನಿಂದ ಪಠ್ಯ ಹೊರತೆಗೆಯಲು ಇಮೇಜ್-ಟು-ಟೆಕ್ಸ್ಟ್ ಟೂಲ್ ಸ್ಟ್ರೀಮ್ಲೈನ್ಡ್ ಅನುಭವ ನೀಡುತ್ತದೆ. ಸ್ಕ್ಯಾನ್ ಆದ PDF PDF ಆಗಿ ಇದ್ದರೆ ಮೊದಲು PDF ಟು JPG ಕನ್ವರ್ಟರ್ ಬಳಸಿ.
OCR ಎಂದರೇನು?
OCR (Optical Character Recognition) ಚಿತ್ರಗಳಲ್ಲಿರುವ ಪಠ್ಯ — ಸ್ಕ್ಯಾನ್ ಆದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳು, ಫೋಟೋಗಳು ಅಥವಾ ಚಿತ್ರ-ಆಧಾರಿತ PDF ಗಳು — ಯಂತ್ರ-ಓದಬಹುದಾದ, ಸಂಪಾದಿಸಬಹುದಾದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಜ್ಞಾನ. OCR ಎಂಜಿನ್ಗಳು ಚಿತ್ರದಲ್ಲಿ ಅಕ್ಷರಗಳ ಆಕಾರಗಳು, ಮಾದರಿಗಳು ಮತ್ತು ಪ್ರಾದೇಶಿಕ ಸಂಬಂಧಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿ ಅಕ್ಷರಗಳು, ಸಂಖ್ಯೆಗಳು ಮತ್ತು ಚಿಹ್ನೆಗಳನ್ನು ಗುರುತಿಸುತ್ತವೆ. ಆಧುನಿಕ OCR ನೂರಾರು ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಡಾಕ್ಯುಮೆಂಟ್ ಡಿಜಿಟಲೀಕರಣ, ಸರ್ಚ್ ಮಾಡಬಹುದಾದ PDF ರಚನೆ ಮತ್ತು ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾ ಎಂಟ್ರಿಯ ಮೂಲಭೂತ ತಂತ್ರಜ್ಞಾನ ಇದು.