Skip to content
LlamaPDFLlamaPDF
🔍

PDF σε Κείμενο (OCR)

Εξαγωγή κειμένου από σαρωμένα PDF

Τελευταία ενημέρωση:

Το OCR εξάγει κείμενο από εικόνες και PDF. Το LlamaPDF ελέγχει πρώτα αν το PDF περιέχει ήδη επιλέξιμο επίπεδο κειμένου και το αντιγράφει απευθείας — γρήγορα και χωρίς απώλειες. Αν όχι (ή για εικόνες), επιστρέφει στο Tesseract.js που τρέχει εξ ολοκλήρου στο πρόγραμμα περιήγησής σου, υποστηρίζοντας 100+ γλώσσες με προαιρετική αυτόματη ανίχνευση.

Σύρτε & αποθέστε το αρχείο σας εδώ

ή κάντε κλικ για επιλογή

.PDF.JPG.PNG.WEBP

Έως 50 MB · Χωρίς εγγραφή

Το αρχείο σας παραμένει στη συσκευή σας — δεν αποστέλλεται ποτέ

Πώς να χρησιμοποιήσετε OCR σε PDF

  1. 1

    Ανεβάστε σαρωμένο PDF ή εικόνα.

  2. 2

    Επιλέξτε γλώσσα εγγράφου.

  3. 3

    Κατεβάστε το επεξεργάσιμο PDF ή αντιγράψτε το κείμενο.

Γιατί να χρησιμοποιήσετε OCR με το LlamaPDF

Τα σαρωμένα PDF δεν επιτρέπουν αναζήτηση ή επεξεργασία κειμένου. Το OCR (Optical Character Recognition) του LlamaPDF αναλύει τις εικόνες και εξάγει το κείμενο — ιδανικό για παλαιά έγγραφα, αποδείξεις και συμβόλαια.

Μετά το OCR, μπορείτε να συμπιέσετε, να διαχωρίσετε ή να προστατεύσετε το αρχείο.

Τι είναι το OCR;

Το OCR (Optical Character Recognition) είναι τεχνολογία που αναγνωρίζει και εξάγει κείμενο από εικόνες και σαρωμένα έγγραφα. Μετατρέπει μη επεξεργάσιμο περιεχόμενο εικόνας σε ψηφιακό κείμενο που μπορεί να αναζητηθεί, αντιγραφεί και επεξεργαστεί.

Συχνές Ερωτήσεις

Ποιες γλώσσες υποστηρίζει το OCR;

Πάνω από 100 γλώσσες μέσω Tesseract.js. Επιλέξτε οποιαδήποτε γλώσσα από το μενού ή συνδυάστε έως 3 για πολύγλωσσα έγγραφα.

Πόσο ακριβής είναι η εξαγωγή κειμένου;

Καθαρές σαρώσεις υψηλής ανάλυσης συνήθως επιτυγχάνουν ακρίβεια 90-98%.

Γιατί μερικές φορές ένα PDF 100 σελίδων επεξεργάζεται σε ένα δευτερόλεπτο;

Αν το PDF διαθέτει ήδη επιλέξιμη στρώση κειμένου (ψηφιακό, όχι σαρωμένο), το κείμενο εξάγεται άμεσα χωρίς εκτέλεση OCR. Για σαρωμένα PDF χωρίς στρώση κειμένου, το πλήρες OCR εκτελείται σε κάθε σελίδα.

Σχετικά Εργαλεία