Skip to content
LlamaPDFLlamaPDF
🔍

PDF til tekst (OCR)

Trekk ut tekst fra skannede PDF-er

Sist oppdatert:

OCR henter ut tekst fra bilder og PDF-er. LlamaPDF sjekker først om PDF-en allerede inneholder et markerbart tekstlag og kopierer det direkte — raskt og tapsfritt. Hvis ikke (eller for bilder), faller den tilbake til Tesseract.js som kjører utelukkende i nettleseren din, og støtter mer enn 100 språk med valgfri auto-deteksjon.

Dra og slipp filen din her

eller klikk for å velge

.PDF.JPG.PNG.WEBP

Maks 50 MB · Ingen registrering nødvendig

Filen din forblir på enheten din — lastes aldri opp

Slik trekker du ut tekst fra en PDF eller et bilde med OCR

  1. 1

    Last opp den skannede PDF-en eller bildefilen ved å dra den inn i boksen ovenfor eller klikke for å bla gjennom. Verktøyet støtter PDF, PNG, JPG, TIFF, BMP og WebP-formater.

  2. 2

    Velg språket i teksten i dokumentet for optimal gjenkjenningsnøyaktighet. For flerspråklige dokumenter velg alle aktuelle språk. OCR-motoren analyserer hele dokumentstrukturen, inkludert kolonner, tabeller og overskrifter.

  3. 3

    Klikk på Trekk ut tekst for å kjøre optisk tegngjenkjenning på dokumentet. Gjennomgå og kopier den utdratte teksten, eller last den ned som en tekstfil. All OCR-behandling kjøres direkte i nettleseren din ved hjelp av avanserte gjenkjenningsalgoritmer — dokumentene dine lastes aldri opp til noen server, noe som sikrer fullstendig personvern.

Hvorfor bruke vårt OCR-verktøy?

Skannede dokumenter, fotograferte sider og bildebaserte PDF-er låser verdifull tekst inne i bilder. Du kan ikke søke, kopiere, redigere eller gjenbruke det innholdet uten å først konvertere det til maskinlesbar tekst. Vårt OCR-verktøy løser dette ved å analysere den visuelle strukturen til dokumentet og trekke ut hvert ord med høy nøyaktighet. Det håndterer alt fra enkeltsidede kvitteringer til flersidede skannede kontrakter og akademiske artikler — gjenkjenner trykt tekst på tvers av titalls språk og bevarer leseordren til komplekse oppsett med flere kolonner og tabeller. All behandling skjer lokalt i nettleseren din — de sensitive dokumentene dine forblir på enheten i full overensstemmelse med GDPR og europeiske personvernregler.

Siden hele prosessen kjøres lokalt i nettleseren din, forlater de sensitive dokumentene dine — juridiske kontrakter, helsejournaler, regnskaper — aldri enheten din. Det er ingen opplasting, ingen skybehandling og ingen tredjepartstilgang. For enklere oppgaver som å trekke ut tekst fra et enkelt bilde eller skjermbilde, gir vårt bilde-til-tekst-verktøy en mer strømlinjeformet opplevelse. Når du har den utdratte teksten, kan du konvertere den til et ordentlig dokument med tekst til PDF-konvertereren, eller redigere den opprinnelige PDF-en direkte. Hvis du trenger å jobbe med skannede tabeller, trekk ut teksten her og bruk deretter JSON-CSV-konvertereren for å strukturere dataene.

Hva er OCR?

OCR (Optical Character Recognition) er en teknologi som konverterer bilder av tekst — enten fra skannede dokumenter, fotografier eller bildebaserte PDF-er — til maskinlesbar, redigerbar tekst. OCR-motorer analyserer formene, mønstrene og de romlige forholdene mellom tegn i et bilde for å identifisere bokstaver, tall og symboler. Moderne OCR støtter hundrevis av språk og kan håndtere et bredt spekter av skrifttyper, størrelser og oppsett. Det er den grunnleggende teknologien bak dokumentdigitalisering, opprettelse av søkbare PDF-er, automatisert dataregistrering og tilgjengelighetsverktøy som leser trykt tekst høyt.

Ofte stilte spørsmål

Hvilke språk støtter OCR?

Over 100 språk via Tesseract.js. Velg et språk fra nedtrekkslisten, eller kombiner opptil 3 for flerspråklige dokumenter.

Hvor nøyaktig er tekstuttrekkingen?

Klare, høyoppløselige skanninger oppnår vanligvis 90–98 % nøyaktighet.

Hvorfor er en PDF på 100 sider noen ganger ferdig på et sekund?

Hvis PDF-en allerede har et merkbart tekstlag (innebygd, ikke skannet), hentes teksten direkte i stedet for å kjøre OCR. For skannede PDF-er uten tekstlag kjøres full OCR på hver side.

Relaterte verktøy