Page 1 of 1

SubtitleEditillä iso I -> pieni l muutos

Posted: Wed Mar 02, 2016 5:53 am
by owla
Riipatessani sarjoja yms. työläin yksittäinen vaihe on tämä iso I -> pieni l muutos. Oikoluku kyllä pysähtyy väärän ison I:n kohdalla ja lähes aina tarjoaa oikeaa l:ällä alkavaa sanaa, mutta isolla L:llä, vaikka sana keskellä lausetta. Joutuu kuitenkin muuttaman käsin pieneksi.

Nimimerkki eonmc2 tarjosi konstiksi, että käyttää:
Tämän takia otankin aina pois raksin OCR-ajon kohdasta "Kysy tuntemattomat sanat" ja korjaan virheet vasta myöhemmin Korjaa tavallisia virheitä -työkalulla.
"Korjaa tavallisia virheitä" kyllä löytää isot I ja korjaa ne pieneksi l:ksi, mutta silloin jää vaan monta muuta virhettä löytymättä ja joutuu ajamaan oikoluvun uudestaan!? (Ja silloin ei näy kuvaa fontista)

Miksi SE ei tarjoa OCR-ajossa pientä l:ää, vaikka tunnistaakin sanan oikein? Voisiko tämän saada ominaisuudeksi, vaikka jonkun valikon taakse?



_

Re: SubtitleEditillä iso I -> pieni l muutos

Posted: Thu Mar 03, 2016 11:52 pm
by eonmc2
Niin tuo on varsin ikävää ettei sitä fonttia näe kuin siinä alkuvaiheessa, olisi hyvä jos se pysyisi nähtävillä kaiken aikaa, samoin ne "Tuntemattomat sanat". Varsinkin vieraskielisten nimien kohdalla olisi hyödyllinen. Käyn yleensä välilyöntivirheet ja epäilyttävien nimien virheet läpi siinä ocr-ajovaiheessa selaamalla tuntemattomat sanat -listan läpi.

Auttaa hiukan jos "Korvaa monta toimintoa" -työkaluun syöttää ilman hakasulkeita "Huomioi kirjainkoko" moodissa seuraavat:

Code: Select all

[ lha] -> [ Iha] [ lsä] -> [ Isä] [ lso] -> [ Iso] [ ltä] -> [ Itä] [lrak] -> [Irak] [lran] -> [Iran] [ltali] -> [Itali] [lsrael] -> [Israel] [lrlan] -> [Irlan] [lntia] -> [Intia] [FBl] -> [FBI] [ClA] -> [CIA]
Näin ei tarvitse jokaista sijamuotoa käydä lävitse noista yleisistä sanan osista. Rivin alussa nuo pienet l:t korvautuvat isoksi I:ksi muistaakseni korjaustyökalulla, en nyt valitettavasti pääse kokeilemaan. Sen takia noissa ylemmissä on välilyönnit että ne korvautuisivat vain rivin alun jälkeen.

Noita "Korvaa monta toiminto" -tiedostoja voi viedä ja tuoda ohjelmaan ja niitä voi muuten käsitellä excelissä.
Excelissä muokattu lista tallennetaan XML-muodossa ja sitten tiedostopääte pitää muuttaa takaisin .templateksi

Tässä on minun varmuuskopiolistani: 2016-03-03.template

Code: Select all

https://mega.nz/#!M9czCRCR!Mzjnq2v05U50rEIxsiAksxiFwcVx-Tx16FDjMHpaGrw
Koitan käydä tuota listaa joskus läpi, siihen kun on kertynyt kaiken näköistä viime vuosien ajan.


edit.

Nuo perusmuodot eli Irak, Iran, Italia.. etc olen lisännytkin Options -> Settings -> Word lists -> OCR Fix listaan.
Mutta se ei löydä sitten muotoja Irakia, Irakissa, Irakista, Irakistako.. etc, joten silloin tuo "Korvaa monta" vaihtaa näissä erikoistatapauksien aluissa lrak[...] -> Irak[...]