PDF ki Tuhinga (OCR)
Tangohia he tuhinga mai i ngā PDF kua matawhaiti
Whakahōutanga whakamutunga:Ka tīkina e te OCR ngā kupu mai i ngā whakaahua me ngā PDF. Ka tirohia tuatahi e LlamaPDF mēnā kei te PDF kē tētahi paparanga kupu e taea te tīpako, ka tāruatia tikahia — he tere, he kore-ngaro. Ki te kore (mō ngā whakaahua rānei), ka hoki ki a Tesseract.js e whakahaeretia ana ki tō pūtirotiro tonu, e tautoko ana i ngā reo 100+ me te tautohu aunoa hei kōwhiringa.
Tōia & tukua tō kōnae ki konei
rānei pāwhiria ki te kōwhiri
50 MB te mutunga · Kāore he rēhita e hiahiatia ana
E noho ana tō kōnae i tō pūrere — kāore i tukuakehia
Me pēhea te tango kuputuhi mai i tētahi PDF, āhua rānei mā te OCR
- 1
Tukuna tōu PDF kua tāirihia, tōu kōnae āhua rānei mā te tō ki roto i te pouaka i runga ake nei, mā te pāwhiri rānei ki te tirotiro. Ka tautoko te taputapu i ngā ahua PDF, PNG, JPG, TIFF, BMP, me WebP.
- 2
Tīpakohia te reo o ngā kuputuhi i roto i tōu tuhinga mō te kounga mōhiotanga tino pai rawa atu. Mō ngā tuhinga rereo-maha, tīpakohia ngā reo katoa e hāngai ana. Ka tātarihia e te kaupeka OCR te hanga katoa o te tuhinga, tae atu ki ngā kapi, tēpū, me ngā upoko.
- 3
Pāwhiritia 'Tango Kuputuhi' ki te whakamahi i te mōhiotanga tohu-ōkiko ki tōu tuhinga. Arotahia, tāruatia rānei ngā kuputuhi i tangohia, tikiakehia rānei hei kōnae kuputuhi. Ka mahia ngā mahi OCR katoa tōtika i roto i tōu pūtirotiro mā ngā kaupeka mōhiotanga kaha — kāore ōu tuhinga e tukupeketia ki tētahi tūmau, ā, ka noho huna katoa.
He aha ai e whakamahi ai i tā mātou taputapu OCR?
Ka takai ngā tuhinga i tāirihia, ngā whārangi i whakaahuatia, me ngā PDF āhua-āpūtanga i ngā kuputuhi hou ki roto i ngā whakaahua. Kāore e taea te rapu, te tāruatia, te whakatika, te whakamahi anō rānei i ērā kōrero, kāore i te hurihanga tuatahi ki te kuputuhi pānuihia e ngā rorohiko. Ka whakaotia tēnei take e tā mātou taputapu OCR mā te tātari i te hanga āhuatia o tōu tuhinga, me te tango i ia kupu me te kounga teitei. Ka mahi pai mō ngā mea katoa mai i ngā tatauranga whārangi-kotahi ki ngā kirimana kua tāirihia whārangi-maha, me ngā pepa akoranga — ka mōhio ki ngā kuputuhi kua tāia i ngā reo maha, ka tiaki i te raupapa pānui o ngā whakaaturanga uaua tae atu ki ngā whārangi kapi-maha me ngā tēpū.
I te mea ka mahia ngā mahi katoa i ō-ōkawa i roto i tōu pūtirotiro, kāore ōu tuhinga tōmuri — ngā kirimana ture, ngā rekoata hauora, ngā tauākī pūtea — e rere atu i tōu taputapu. Kāore he tukupeketanga, kāore he mahi kapua, kāore he urunga papa-tuatoru. Mō ngā mahi māmā ake pērā i te tango kuputuhi mai i tētahi whakaahua kotahi, tētahi tārua mata rānei, ka homai e tā mātou taputapu āhua-ki-kuputuhi tētahi wheako māmā ake. Ina rite ōu kuputuhi i tangohia, hurihia ēnei hei tuhinga ātea mā te kaihuri PDF ki JPG, ka āhei rānei koe ki te whakamahi i te kaihuri JSON-CSV ki te whakarite ōu raraunga kua tangohia mai i ngā tēpū.
He aha te OCR?
Ko OCR (Optical Character Recognition) he hangarau e huri ana i ngā āhua kuputuhi — ahakoa mai i ngā tuhinga i tāirihia, mai i ngā whakaahua, mai i ngā PDF āhua-āpūtanga rānei — ki ngā kuputuhi pānuihia, ōritetia e ngā rorohiko. Ka tātarihia e ngā kaupeka OCR ngā āhua, ngā tauira, me ngā hononga ā-wāhi o ngā tohu ki roto i tētahi āhua ki te tohu i ngā reta, ngā tau, me ngā tohu. Ka tautoko ngā OCR hou i ngā reo rau, ā, ka āhei ki te mahi i ngā momo mita, rahi, whakaaturanga hoki. Ko ia te hangarau tūāpapa kei muri i te whakamatihikotanga tuhinga, te hanga PDF kimi-reo, te urunga raraunga aunoa, me ngā taputapu ārahina e kōrero ana i ngā kuputuhi kua tāia ki te reo ororongo.