Skip to content
LlamaPDFLlamaPDF
🔍

PDF till text (OCR)

Extrahera text från skannade PDF:er

Senast uppdaterad:

OCR plockar ut text ur bilder och PDF:er. LlamaPDF kontrollerar först om PDF:en redan innehåller ett markerbart textlager och kopierar det direkt — snabbt och förlustfritt. Annars (eller för bilder) faller verktyget tillbaka på Tesseract.js som körs helt i din webbläsare och stöder 100+ languages med valfri automatisk språkdetektering.

Dra och släpp din fil här

eller klicka för att välja

.PDF.JPG.PNG.WEBP

Max 50 MB · Ingen registrering krävs

Din fil stannar på din enhet — laddas aldrig upp

Så extraherar du text från en PDF eller bild med OCR

  1. 1

    Ladda upp din skannade PDF eller bildfil genom att dra den till rutan ovan eller klicka för att bläddra. Verktyget stöder PDF, PNG, JPG, TIFF, BMP och WebP.

  2. 2

    Välj språket i texten i ditt dokument för optimal igenkänningsnoggrannhet. För flerspråkiga dokument, välj alla tillämpliga språk. OCR-motorn analyserar hela dokumentstrukturen, inklusive kolumner, tabeller och rubriker.

  3. 3

    Klicka på Extrahera text för att köra optisk teckenigenkänning på ditt dokument. Granska och kopiera den extraherade texten, eller ladda ned den som en textfil. All OCR-bearbetning körs direkt i din webbläsare med avancerade igenkänningsalgoritmer — dina dokument laddas aldrig upp till någon server, vilket garanterar fullständig integritet.

Varför använda vårt OCR-verktyg?

Skannade dokument, fotograferade sidor och bildbaserade PDF:er låser in värdefull text i bilder. Du kan inte söka, kopiera, redigera eller återanvända det innehållet utan att först konvertera det till maskinläsbar text. Vårt OCR-verktyg löser detta genom att analysera den visuella strukturen i ditt dokument och extrahera varje ord med hög noggrannhet. Det hanterar allt från enstaka skannade kvitton till flersidiga skannade kontrakt och akademiska artiklar — och känner igen tryckt text på dussintals språk samtidigt som läsordningen i komplexa layouter med flerkolumnssidor och tabeller bevaras.

Eftersom hela processen körs lokalt i din webbläsare lämnar dina känsliga dokument — juridiska kontrakt, patientjournaler, bokslut — aldrig din enhet. Det finns ingen uppladdning, ingen molnbearbetning och ingen tredjepartsåtkomst. För enklare uppgifter som att extrahera text från ett enstaka foto eller en skärmbild ger vårt bild-till-text-verktyg en strömlinjeformad upplevelse. När du väl har din extraherade text kan du konvertera den till ett riktigt dokument med text till PDF-konverteraren, eller redigera den ursprungliga PDF:en direkt. Om du behöver arbeta med skannade tabeller kan du extrahera texten här och sedan använda JSON-CSV-konverteraren för att strukturera din data.

Vad är OCR?

OCR (Optical Character Recognition) är en teknologi som omvandlar bilder av text — oavsett om de kommer från skannade dokument, fotografier eller bildbaserade PDF:er — till maskinläsbar, redigerbar text. OCR-motorer analyserar former, mönster och rumsliga relationer mellan tecken i en bild för att identifiera bokstäver, siffror och symboler. Modern OCR stöder hundratals språk och kan hantera ett brett spektrum av typsnitt, storlekar och layouter. Det är den grundläggande teknologin bakom dokumentdigitalisering, sökbar PDF-skapande, automatiserad datainmatning och tillgänglighetsverktyg som läser tryckt text högt.

Vanliga frågor

Vilka språk stöder OCR?

Över 100 språk via Tesseract.js. Välj ett språk i listan eller kombinera upp till 3 för flerspråkiga dokument.

Hur noggrann är textextraktionen?

Tydliga skanningar med hög upplösning uppnår vanligtvis 90–98 % noggrannhet.

Varför blir en PDF på 100 sidor ibland klar på en sekund?

Om PDF:en redan har ett markerbart textlager (inbyggt, inte skannat) hämtas texten direkt i stället för att köra OCR. För skannade PDF:er utan textlager körs full OCR på varje sida.

Relaterade verktyg