PDF til tekst (OCR)
Trekk ut tekst fra skannede PDF-er
Sist oppdatert:OCR henter ut tekst fra bilder og PDF-er. LlamaPDF sjekker først om PDF-en allerede inneholder et markerbart tekstlag og kopierer det direkte — raskt og tapsfritt. Hvis ikke (eller for bilder), faller den tilbake til Tesseract.js som kjører utelukkende i nettleseren din, og støtter mer enn 100 språk med valgfri auto-deteksjon.
Dra og slipp filen din her
eller klikk for å velge
Maks 50 MB · Ingen registrering nødvendig
Filen din forblir på enheten din — lastes aldri opp
Slik trekker du ut tekst fra en PDF eller et bilde med OCR
- 1
Last opp den skannede PDF-en eller bildefilen ved å dra den inn i boksen ovenfor eller klikke for å bla gjennom. Verktøyet støtter PDF, PNG, JPG, TIFF, BMP og WebP-formater.
- 2
Velg språket i teksten i dokumentet for optimal gjenkjenningsnøyaktighet. For flerspråklige dokumenter velg alle aktuelle språk. OCR-motoren analyserer hele dokumentstrukturen, inkludert kolonner, tabeller og overskrifter.
- 3
Klikk på Trekk ut tekst for å kjøre optisk tegngjenkjenning på dokumentet. Gjennomgå og kopier den utdratte teksten, eller last den ned som en tekstfil. All OCR-behandling kjøres direkte i nettleseren din ved hjelp av avanserte gjenkjenningsalgoritmer — dokumentene dine lastes aldri opp til noen server, noe som sikrer fullstendig personvern.
Hvorfor bruke vårt OCR-verktøy?
Skannede dokumenter, fotograferte sider og bildebaserte PDF-er låser verdifull tekst inne i bilder. Du kan ikke søke, kopiere, redigere eller gjenbruke det innholdet uten å først konvertere det til maskinlesbar tekst. Vårt OCR-verktøy løser dette ved å analysere den visuelle strukturen til dokumentet og trekke ut hvert ord med høy nøyaktighet. Det håndterer alt fra enkeltsidede kvitteringer til flersidede skannede kontrakter og akademiske artikler — gjenkjenner trykt tekst på tvers av titalls språk og bevarer leseordren til komplekse oppsett med flere kolonner og tabeller. All behandling skjer lokalt i nettleseren din — de sensitive dokumentene dine forblir på enheten i full overensstemmelse med GDPR og europeiske personvernregler.
Siden hele prosessen kjøres lokalt i nettleseren din, forlater de sensitive dokumentene dine — juridiske kontrakter, helsejournaler, regnskaper — aldri enheten din. Det er ingen opplasting, ingen skybehandling og ingen tredjepartstilgang. For enklere oppgaver som å trekke ut tekst fra et enkelt bilde eller skjermbilde, gir vårt bilde-til-tekst-verktøy en mer strømlinjeformet opplevelse. Når du har den utdratte teksten, kan du konvertere den til et ordentlig dokument med tekst til PDF-konvertereren, eller redigere den opprinnelige PDF-en direkte. Hvis du trenger å jobbe med skannede tabeller, trekk ut teksten her og bruk deretter JSON-CSV-konvertereren for å strukturere dataene.
Hva er OCR?
OCR (Optical Character Recognition) er en teknologi som konverterer bilder av tekst — enten fra skannede dokumenter, fotografier eller bildebaserte PDF-er — til maskinlesbar, redigerbar tekst. OCR-motorer analyserer formene, mønstrene og de romlige forholdene mellom tegn i et bilde for å identifisere bokstaver, tall og symboler. Moderne OCR støtter hundrevis av språk og kan håndtere et bredt spekter av skrifttyper, størrelser og oppsett. Det er den grunnleggende teknologien bak dokumentdigitalisering, opprettelse av søkbare PDF-er, automatisert dataregistrering og tilgjengelighetsverktøy som leser trykt tekst høyt.