Niin tuo on varsin ikävää ettei sitä fonttia näe kuin siinä alkuvaiheessa, olisi hyvä jos se pysyisi nähtävillä kaiken aikaa, samoin ne "Tuntemattomat sanat". Varsinkin vieraskielisten nimien kohdalla olisi hyödyllinen. Käyn yleensä välilyöntivirheet ja epäilyttävien nimien virheet läpi siinä ocr-ajovaiheessa selaamalla tuntemattomat sanat -listan läpi.
Auttaa hiukan jos "Korvaa monta toimintoa" -työkaluun syöttää ilman hakasulkeita "Huomioi kirjainkoko" moodissa seuraavat:
Code: Select all
[ lha] -> [ Iha]
[ lsä] -> [ Isä]
[ lso] -> [ Iso]
[ ltä] -> [ Itä]
[lrak] -> [Irak]
[lran] -> [Iran]
[ltali] -> [Itali]
[lsrael] -> [Israel]
[lrlan] -> [Irlan]
[lntia] -> [Intia]
[FBl] -> [FBI]
[ClA] -> [CIA]
Näin ei tarvitse jokaista sijamuotoa käydä lävitse noista yleisistä sanan osista. Rivin alussa nuo pienet l:t korvautuvat isoksi I:ksi muistaakseni korjaustyökalulla, en nyt valitettavasti pääse kokeilemaan. Sen takia noissa ylemmissä on välilyönnit että ne korvautuisivat vain rivin alun jälkeen.
Noita "Korvaa monta toiminto" -tiedostoja voi viedä ja tuoda ohjelmaan ja niitä voi muuten käsitellä excelissä.
Excelissä muokattu lista tallennetaan XML-muodossa ja sitten tiedostopääte pitää muuttaa takaisin .templateksi
Tässä on minun varmuuskopiolistani: 2016-03-03.template
Code: Select all
https://mega.nz/#!M9czCRCR!Mzjnq2v05U50rEIxsiAksxiFwcVx-Tx16FDjMHpaGrw
Koitan käydä tuota listaa joskus läpi, siihen kun on kertynyt kaiken näköistä viime vuosien ajan.
edit.
Nuo perusmuodot eli Irak, Iran, Italia.. etc olen lisännytkin Options -> Settings -> Word lists -> OCR Fix listaan.
Mutta se ei löydä sitten muotoja Irakia, Irakissa, Irakista, Irakistako.. etc, joten silloin tuo "Korvaa monta" vaihtaa näissä erikoistatapauksien aluissa lrak[...] -> Irak[...]