Skip to content
LlamaPDFLlamaPDF
🔍

PDF til tekst (OCR)

Udtræk tekst fra scannede PDF-filer

Sidst opdateret:

OCR udtrækker tekst fra billeder og PDF'er. LlamaPDF tjekker først, om PDF'en allerede indeholder et markerbart tekstlag og kopierer det direkte — hurtigt og tabsfrit. Hvis ikke (eller for billeder), falder den tilbage til Tesseract.js, der kører udelukkende i din browser, og understøtter mere end 100 sprog med valgfri autodetektion.

Træk og slip din fil her

eller klik for at vælge

.PDF.JPG.PNG.WEBP

Maks. 50 MB · Ingen registrering nødvendig

Din fil forbliver på din enhed — uploades aldrig

Sådan udtrækker du tekst fra en PDF eller et billede med OCR

  1. 1

    Upload din skannede PDF eller billedfil ved at trække den ind i feltet ovenfor eller klikke for at gennemse. Værktøjet understøtter PDF, PNG, JPG, TIFF, BMP og WebP-formater.

  2. 2

    Vælg sproget i teksten i dit dokument for optimal genkendelsesnøjagtighed. Til flersprogede dokumenter vælg alle relevante sprog. OCR-motoren analyserer hele dokumentstrukturen, herunder kolonner, tabeller og overskrifter.

  3. 3

    Klik på Udtræk tekst for at køre optisk tegngenkendelse på dit dokument. Gennemgå og kopier den udtrukne tekst, eller download den som en tekstfil. Al OCR-behandling kører direkte i din browser ved hjælp af avancerede genkendelsesalgoritmer — dine dokumenter uploades aldrig til nogen server, hvilket sikrer fuldstændig fortrolighed.

Hvorfor bruge vores OCR-værktøj?

Skannede dokumenter, fotograferede sider og billedbaserede PDF'er låser værdifuld tekst inde i billeder. Du kan ikke søge, kopiere, redigere eller genbruge det indhold uden først at konvertere det til maskinlæsbar tekst. Vores OCR-værktøj løser dette ved at analysere den visuelle struktur af dit dokument og udtrække hvert ord med høj nøjagtighed. Det håndterer alt fra enkeltsidede kvitteringer til flersidede skannede kontrakter og akademiske artikler — genkender trykt tekst på tværs af snesevis af sprog og bevarer læserækkefølgen af komplekse layouts med flere kolonner og tabeller. Al behandling sker lokalt i din browser — dine følsomme dokumenter forbliver på din enhed i fuld overensstemmelse med GDPR og europæiske databeskyttelsesregler.

Da hele processen kører lokalt i din browser, forlader dine følsomme dokumenter — juridiske kontrakter, lægejournaler, regnskaber — aldrig din enhed. Der er ingen upload, ingen cloudbehandling og ingen tredjepartsadgang. Til enklere opgaver som at udtrække tekst fra et enkelt foto eller skærmbillede giver vores billede-til-tekst-værktøj en mere strømlinet oplevelse. Når du har din udtrukne tekst, kan du konvertere den til et ordentligt dokument med tekst til PDF-konverteren, eller redigere den originale PDF direkte. Hvis du skal arbejde med skannede tabeller, kan du udtrække teksten her og derefter bruge JSON-CSV-konverteren til at strukturere dine data.

Hvad er OCR?

OCR (Optical Character Recognition) er en teknologi, der konverterer billeder af tekst — uanset om det er fra skannede dokumenter, fotografier eller billedbaserede PDF'er — til maskinlæsbar, redigerbar tekst. OCR-motorer analyserer formerne, mønstrene og de rumlige relationer mellem tegn i et billede for at identificere bogstaver, tal og symboler. Moderne OCR understøtter hundredvis af sprog og kan håndtere en bred vifte af skrifttyper, størrelser og layouts. Det er den grundlæggende teknologi bag dokumentdigitalisering, oprettelse af søgbare PDF'er, automatiseret dataindtastning og tilgængelighdsværktøjer, der læser trykt tekst højt.

Ofte stillede spørgsmål

Hvilke sprog understøtter OCR?

Over 100 sprog via Tesseract.js. Vælg et sprog i rullemenuen, eller kombiner op til 3 til flersprogede dokumenter.

Hvor præcis er tekstudtrækningen?

Klare, høj-opløsningsscanninger opnår typisk 90-98 % nøjagtighed.

Hvorfor er en PDF på 100 sider nogle gange færdig på et sekund?

Hvis PDF'en allerede har et markerbart tekstlag (native, ikke scannet), hentes teksten direkte i stedet for at køre OCR. For scannede PDF'er uden tekstlag køres fuld OCR på hver side.

Relaterede værktøjer