Herken teks in 'n PDF-lêer aanlyn

Pin
Send
Share
Send


Dit is verre van altyd moontlik om teks met behulp van gereelde kopiëring uit 'n PDF-lêer te onttrek. Dikwels is die bladsye van sulke dokumente geskandeerde inhoud van die papierweergawes. Om sulke lêers in volledig bewerkbare teksdata te omskep, word spesiale programme met die OCR-funksie (Optical Character Recognition) gebruik.

Sulke besluite is baie moeilik om te implementeer en kos dus baie geld. As u teks vanaf PDF gereeld moet herken, is dit raadsaam om die toepaslike program aan te koop. In seldsame gevalle is dit meer logies om een ​​van die beskikbare aanlyndienste met soortgelyke funksies te gebruik.

Hoe om teks vanaf PDF aanlyn te herken

Natuurlik is die reeks funksies van OCR-aanlyndienste, in vergelyking met volwaardige lessenaaroplossings, meer beperk. Maar u kan ook gratis of teen 'n nominale fooi met sulke hulpbronne werk. Die belangrikste is dat die ooreenstemmende webtoepassings net so goed met hul hooftaak, naamlik met teksherkenning, klaarkom.

Metode 1: ABBYY FineReader aanlyn

Die diensontwikkelingsonderneming is een van die leiers op die gebied van optiese dokumentherkenning. ABBYY FineReader vir Windows en Mac is 'n kragtige oplossing om PDF na teks om te skakel en daarmee verder te werk.

Die web-gebaseerde analoog van die program is natuurlik minderwaardig daaraan toe dit funksionaliteit het. Nietemin kan die diens teks herken vanaf skanderings en foto's in meer as 190 tale. Omskep PDF-lêers na dokumente in Word, Excel, ens. Word ondersteun.

ABBYY FineReader aanlyn-aanlyndiens

  1. Voordat u met die instrument begin werk, skep u 'n rekening op die webwerf of meld u aan met u Facebook-, Google- of Microsoft-rekening.

    Klik op die knoppie om na die magtigingsvenster te gaan "Teken in" in die boonste menubalk.
  2. Nadat u aangemeld is, voer u die gewenste PDF-dokument in FineReader in met die knoppie “Laai lêers op”.

    Klik dan "Kies bladsynommers" en spesifiseer die gewenste interval vir teksherkenning.
  3. Kies vervolgens die tale wat in die dokument teenwoordig is, die formaat van die resulterende lêer en klik op die knoppie "Erken".
  4. Na verwerking, waarvan die duur heeltemal afhang van die volume van die dokument, kan u die voltooide lêer met teksdata aflaai deur eenvoudig op die naam te klik.

    Of voer dit uit na een van die beskikbare wolkdienste.

Die diens word waarskynlik onderskei deur die akkuraatste teksherkenningsalgoritmes op beelde en PDF-lêers. Ongelukkig is die gratis gebruik daarvan beperk tot vyf bladsye wat per maand verwerk word. Om met meer omvattende dokumente te werk, moet u 'n jaarlikse intekening koop.

As OCR egter selde nodig is, is ABBYY FineReader Online 'n uitstekende opsie om teks uit klein PDF-lêers te onttrek.

Metode 2: Gratis aanlyn-OCR

Eenvoudige en maklike diens vir die digitalisering van teks. Sonder registrasie kan die bron 15 volledige PDF-bladsye per uur herken. Free Online OCR werk ten volle met dokumente in 46 tale en ondersteun sonder drie toestemming drie teksuitvoerformate - DOCX, XLSX en TXT.

By registrasie kry die gebruiker die geleentheid om dokumente met meerdere bladsye te verwerk, maar die gratis aantal van dieselfde bladsye is beperk tot 50 eenhede.

Gratis aanlyn-OCR-aanlyndiens

  1. Gebruik die toepaslike vorm op die hoofblad van die webwerf om die teks vanaf PDF as 'n 'gas' te herken sonder toestemming van die bron.

    Kies die gewenste dokument met die knoppie "File", spesifiseer die hooftaal van die teks, die uitvoerformaat, en wag dan vir die lêer om te laai en klik "Skakel".
  2. Klik aan die einde van die digitaliseringsproses "Laai die uitvoerlêer af" om die voltooide dokument met teks op die rekenaar te stoor.

Vir gemagtigde gebruikers is die volgorde van aksies ietwat anders.

  1. Gebruik die knoppie "Registrasie" of "Teken in" in die boonste menubalk om 'n gratis aanlyn-OCR-rekening te skep of aan te meld.
  2. Nadat u toestemming in die herkenningspaneel gekry het, hou u die sleutel in «Ctrl», kies tot twee tale van die brondokument uit die gegewe lys.
  3. Spesifiseer verdere opsies om teks uit PDF te onttrek en klik Kies lêer om 'n dokument na die diens op te laai.

    Klik dan op om die erkenning te begin "Skakel".
  4. Aan die einde van die verwerking van die dokument, klik op die skakel met die naam van die uitvoerlêer in die ooreenstemmende kolom.

    Die herkenningsresultaat word onmiddellik in die geheue van u rekenaar gestoor.

As u teks uit 'n klein PDF-dokument moet onttrek, kan u veilig gebruik maak van die bogenoemde instrument. Om met groot lêers te werk, moet u ekstra karakters in Free Online OCR koop of 'n ander oplossing gebruik.

Metode 3: NewOCR

Heeltemal gratis OCR-diens waarmee u teks uit byna enige grafiese en elektroniese dokumente soos DjVu en PDF kan onttrek. Die bron plaas nie beperkings op die grootte en aantal erkende lêers nie, hoef nie registrasie te hê nie en bied 'n wye verskeidenheid verwante funksies.

NewOCR ondersteun 106 tale en kan selfs dokumentkanderings van lae gehalte korrek verwerk. Dit is moontlik om die area vir teksherkenning met die hand op die lêerbladsy te kies.

NewOCR Aanlyndiens

  1. U kan dus onmiddellik met 'n hulpbron begin werk sonder dat u onnodige aksies hoef uit te voer.

    Op die hoofblad is daar 'n vorm om 'n dokument na die webwerf in te voer. Gebruik die knoppie om 'n lêer na NewOCR op te laai "Kies lêer" in die afdeling "Kies u lêer". Dan in die veld "Erkenningstaal (s)" spesifiseer een of meer tale van die brondokument en klik dan op "Laai + OCR op".
  2. Stel u instellings vir voorkeurherkenning in, kies die bladsy waaruit u teks wil onttrek en klik op die knoppie «OCR».
  3. Blaai 'n bietjie af op die bladsy en vind die knoppie «Aflaai».

    Klik daarop en kies die vereiste dokumentformaat vir aflaai van die keuselys. Daarna word die voltooide lêer met die onttrekte teks na u rekenaar afgelaai.

Die instrument is gerieflik en redelik hoë gehalte herken al die karakters. Die verwerking van elke bladsy van die ingevoerde PDF-dokument moet egter onafhanklik begin word en dit word in 'n aparte lêer vertoon. U kan natuurlik die herkenningsresultate onmiddellik na die knipbord kopieer en met ander kombineer.

Gegewe die nuanse wat hierbo beskryf is, is dit nietemin baie moeilik om groot hoeveelhede teks met behulp van NewOCR uit te haal. Met klein lêers hanteer die diens 'n knal.

Metode 4: OCR.Space

Dit is 'n eenvoudige en verstaanbare bron vir die digitalisering van teks, en dit stel u in staat PDF-dokumente te herken en die resultaat na 'n TXT-lêer uit te voer. Geen aantal perke word voorsien nie. Die enigste beperking is dat die grootte van die insetdokument nie meer as 5 megabyte moet wees nie.

OCR.Space Aanlyndiens

  1. Registreer om met die instrument te werk, is nie nodig nie.

    Volg die skakel hierbo en laai die PDF-dokument vanaf die rekenaar op die webwerf op met die knoppie "Kies lêer" of vanaf die netwerk - met verwysing.
  2. In die aftreklys "Kies OCR-taal" Kies die taal van die ingevoerde dokument.

    Begin dan met die teksherkenningsproses deur op die knoppie te klik "Begin OCR!".
  3. Lees die resultaat in die veld aan die einde van die verwerking van die lêer OCR-resultaat en klik «Aflaai»om die voltooide TXT-dokument af te laai.

As u net die teks uit die PDF moet uittreksel en die finale formatering daarvan terselfdertyd glad nie belangrik is nie, is OCR.Space 'n goeie keuse. Die enigste ding is dat die dokument “eentalig” moet wees, aangesien daar nie voorsiening gemaak word vir erkenning van twee of meer tale gelyktydig in die diens nie.

Kyk ook: Gratis analoë van FineReader

By die beoordeling van die aanlyninstrumente wat in die artikel aangebied word, moet daarop gelet word dat FineReader Online van ABBYY die OCR-funksie die mees akkurate en doeltreffendste hanteer. As die maksimum akkuraatheid van teksherkenning vir u belangrik is, is dit die beste om hierdie opsie spesifiek te oorweeg. Maar waarskynlik sal u ook daarvoor moet betaal.

As u klein dokumente moet digitaliseer en u gereed is om foute by die diens onafhanklik te korrigeer, is dit raadsaam om NewOCR, OCR.Space of Free Online OCR te gebruik.

Pin
Send
Share
Send