Hoe vertaal u 'n prent in teks met ABBYY FineReader?

Pin
Send
Share
Send

Hierdie artikel is 'n toevoeging tot die vorige (//pcpro100.info/skanirovanie-teksta/), en sal die kern van direkte teksherkenning in meer besonderhede openbaar.

Kom ons begin met die wese wat baie gebruikers nie ten volle begryp nie.

Nadat u 'n boek, koerant, tydskrif, ens. Geskandeer het, kry u 'n stel foto's (dit wil sê grafiese lêers, nie tekslêers nie) wat u in 'n spesiale program moet herken (een van die beste hiervoor is ABBYY FineReader). Erkenning - dit is dit, die proses om teks vanaf grafika te verkry, en dit is hierdie proses wat ons in meer besonderhede sal beskryf.

In my voorbeeld neem ek 'n kiekie van hierdie webwerf en probeer teks daaruit haal.

 

1) Die opening van 'n lêer

Maak die prent (e) oop wat ons beplan om te herken.

Terloops, hier moet daarop gelet word dat u nie net beeldformate kan oopmaak nie, maar ook, byvoorbeeld, DJVU- en PDF-lêers. Hiermee kan u die hele boek, wat gewoonlik in hierdie formate versprei is, vinnig herken.

2) Redigering

Onmiddellik saamstem met outo-erkenning maak dit nie veel sin nie. As u natuurlik 'n boek het waarin slegs teks bestaan, daar geen foto's en plate is nie, en dit word in uitstekende gehalte geskandeer, dan kan u dit doen. In ander gevalle is dit beter om alle gebiede met die hand in te stel.

Gewoonlik moet u eers onnodige gebiede van die bladsy verwyder. Klik hierop op die knoppie op die paneelbewerking.

Dan moet u slegs die gebied waarmee u langer wil werk, verlaat. Daar is 'n instrument om ongewenste grense te snoei. Kies die modus in die regterkolom oes.

Kies nou die gebied wat u wil verlaat. Op die foto hieronder is dit in rooi gemerk.

Terloops, as u verskeie prente oop het, kan u tegelykertyd 'n sny op alle prente toepas! Gerieflik om nie elkeen afsonderlik te sny nie. Let daarop, onderaan hierdie paneel is daar nog 'n wonderlike instrument -uitveër. Deur dit te gebruik, kan u ongewenste vlekke, bladsynommers, spikkels, onnodige spesiale karakters en individuele afdelings uit die prentjie uitvee.

Nadat u geklik het om die rande te sny, moet u oorspronklike foto verander: slegs die werkarea bly oor.

Dan kan u die beeldredakteur verlaat.

3) Uitliggebiede

Op die paneel bo die oop prentjie is daar klein reghoeke wat die skanderingarea definieer. Daar is verskeie van hulle, wat kortliks die algemeenste beskou.

Beeld - die program herken nie hierdie gebied nie, kopieer eenvoudig die gespesifiseerde reghoek en plak dit in die erkende dokument.

Teks is die hoofarea waarop die program fokus en probeer teks uit die prentjie haal. Ons sal hierdie voorbeeld in ons voorbeeld uitlig.

Na keuring word die gebied in liggroen geverf. Dan kan u voortgaan met die volgende stap.

4) Teksherkenning

Nadat alle gebiede gedefinieër is, klik op die herkenning-opdrag in die menu. Gelukkig is daar niks meer nodig in hierdie stap nie.

Erkenningstyd hang af van die aantal bladsye in u dokument en die krag van die rekenaar.

Gemiddeld duur een volledige bladsy wat in goeie gehalte geskandeer is, 10-20 sekondes. gemiddelde rekenaarkrag (volgens vandag se standaarde).

 

5) Foutkontrole

Ongeag die aanvanklike kwaliteit van die foto's, bly foute altyd na herkenning. Alhoewel, tot dusver kon geen program menslike werk heeltemal uitsluit nie.

Klik op die opsie en ABBYY FineReader sal die plekke in die dokument waar dit gestruikel het, een vir een begin vertoon. U taak om die oorspronklike prent te vergelyk (terloops, dit sal u in 'n vergrote weergawe wys) met die herkenningsopsie - bevestig bevestigend, of korrigeer en keur dit goed. Dan gaan die program na die volgende moeilike plek en so aan totdat die hele dokument gekontroleer is.

 

Oor die algemeen kan hierdie proses lank en vervelig wees ...

6) Besparing

ABBYY FineReader bied verskeie opsies om u werk te bespaar. Die een wat die meeste gebruik word, is die "presiese eksemplaar". dit wil sê die hele dokument, die teks daarin, sal sowel as die bron geformateer word, 'n maklike opsie om dit na Word oor te dra. Ons het dus in hierdie voorbeeld gedoen.

Daarna sal u u erkende teks in 'n bekende Word-dokument sien. Ek dink daar is nie veel sin om verder te verf wat om daarmee te doen nie ...

Dus het ons 'n konkrete voorbeeld gemaak van hoe om 'n prentjie in gewone teks te vertaal. Hierdie proses is nie altyd eenvoudig en vinnig nie.

In elk geval hang alles af van die kwaliteit van die bron, u ervaring en rekenaarsnelheid.

Baie goeie werk!

 

Pin
Send
Share
Send