🔍

PDF i Destun (OCR)

Echdynnu testun o PDFs wedi'u sganio

Diweddarwyd ddiwethaf: 14 Mai 2026

Mae OCR yn echdynnu testun o ddelweddau a PDFau. Mae LlamaPDF yn gyntaf yn gwirio a yw'r PDF eisoes yn cynnwys haen destun ddewisadwy ac yn ei chopïo'n uniongyrchol — yn gyflym a di-golled. Os nad yw (neu ar gyfer delweddau), mae'n disgyn yn ôl ar Tesseract.js sy'n rhedeg yn gyfan gwbl yn eich porwr, gan gefnogi 100+ o ieithoedd gyda chanfod awtomatig dewisol.

Llusgwch a gollyngwch eich ffeil yma

neu cliciwch i ddewis

.PDF.JPG.PNG.WEBP

Uchafswm 50 MB · Dim angen cofrestru

Mae eich ffeil yn aros ar eich dyfais — ni chaiff ei huwchlwytho byth

Sut i echdynnu testun o PDF neu ddelwedd gyda OCR

1
Llwythwch eich ffeil PDF wedi'i sganio neu ddelwedd drwy ei llusgo i'r blwch uchod neu cliciwch i bori. Mae'r teclyn yn cefnogi fformatau PDF, PNG, JPG, TIFF, BMP, a WebP.
2
Dewiswch iaith y testun yn eich dogfen at gywirdeb adnabod gorau. Ar gyfer dogfennau amlieithog, dewiswch bob iaith berthnasol. Bydd peiriant OCR yn dadansoddi'r holl strwythur dogfen, gan gynnwys colofnau, tablau, a phennawdau.
3
Cliciwch Echdynnu Testun i redeg adnabyddiaeth nod optegol ar eich dogfen. Adolygwch a chopïwch y testun a echdynnwyd, neu lawrlwythwch ef fel ffeil testun. Mae'r holl brosesu OCR yn rhedeg yn uniongyrchol yn eich porwr gan ddefnyddio algorithmau adnabod datblygedig — nid yw eich dogfennau byth yn cael eu llwytho i unrhyw weinydd, gan sicrhau preifatrwydd llwyr.

Pam defnyddio ein teclyn OCR?

Mae dogfennau wedi'u sganio, tudalennau â llun, a PDFs seiliedig ar ddelwedd yn clo testun gwerthfawr tu mewn i luniau. Ni allwch chwilio, copïo, golygu, na haddefnyddio'r cynnwys hwnnw heb yn gyntaf ei drawsnewid i destun darllenant gan beiriant. Mae ein teclyn OCR yn datrys hyn drwy ddadansoddi strwythur gweledol eich dogfen ac echdynnu pob gair gyda chywirdeb uchel. Mae'n trin popeth o dderbynebau un tudalen i gontractau wedi'u sganio a phaperau academaidd aml-dudalen — yn adnabod testun printiedig ar draws dwsinau o ieithoedd ac yn diogelu trefn darllen cynlluniau cymhleth gan gynnwys tudalennau aml-golofn a thablau.

Oherwydd bod yr holl broses yn rhedeg yn lleol yn eich porwr, mae eich dogfennau sensitif — contractau cyfreithiol, cofnodion meddygol, datganiadau ariannol — byth yn gadael eich dyfais. Nid oes unrhyw lwytho, nid oes prosesu cwmwl, a nid oes mynediad trydydd parti. Ar gyfer tasgau symlach fel echdynnu testun o ffotograff neu sgrinlun sengl, mae ein teclyn delwedd-i-destun yn darparu profiad symlach. Unwaith y bydd gennych eich testun a echdynnwyd, trosi ef i ddogfen briodol gyda'r troswr testun i PDF, neu olygu'r PDF gwreiddiol yn uniongyrchol. Os oes angen i chi weithio gyda thablau wedi'u sganio, echdynnwch y testun yma ac yna defnyddiwch y troswr JSON-CSV i strwythuro'ch data.

Beth yw OCR?

Mae OCR (Optical Character Recognition) yn dechnoleg sy'n trosi delweddau o destun — boed o ddogfennau wedi'u sganio, ffotograffau, neu PDFs seiliedig ar ddelwedd — i destun darllenant, y gellir ei olygu. Mae peiriannau OCR yn dadansoddi siapiau, patrymau, a pherthnasoedd gofodol cymeriadau mewn delwedd i adnabod llythrennau, rhifau, a symbolau. Mae OCR modern yn cefnogi cannoedd o ieithoedd ac yn gallu trin ystod eang o ffontiau, meintiau, a cynlluniau. Dyma'r dechnoleg sylfaenol y tu ôl i ddigideiddio dogfennau, creu PDFs y gellir eu chwilio, mewnbwn data awtomataidd, ac offer hygyrchedd sy'n darllen testun printiedig yn uchel.

Cwestiynau Cyffredin

Pa ieithoedd mae OCR yn eu cefnogi?

Dros 100 o ieithoedd trwy Tesseract.js. Dewiswch unrhyw iaith o'r gwymplen, neu gyfunwch hyd at 3 ar gyfer dogfennau amlieithog.

Pa mor gywir yw'r echdynnu testun?

Mae sganiau clir a datrysiad uchel fel arfer yn cyrraedd 90-98% o gywirdeb.

Pam mae'n gorffen weithiau mewn eiliad ar gyfer PDF 100 tudalen?

Os oes gan y PDF haen destun ddewisadwy eisoes (brodorol, nid wedi'i sganio), caiff y testun ei echdynnu'n uniongyrchol yn lle rhedeg OCR. Ar gyfer PDFs wedi'u sganio heb haen destun, mae OCR llawn yn rhedeg ar bob tudalen.

Offer Cysylltiedig

📝PDF i Destun