Forum rules
Under no circumstances is spamming or advertising of any kind allowed. Do not post any abusive, obscene, vulgar, slanderous, hateful, threatening, sexually-orientated or any other material that may violate others security. Profanity or any kind of insolent behavior to other members (regardless of rank) will not be tolerated. Remember, what you don’t find offensive can be offensive to other members. Please treat each other with the kind of reverence you’d expect from other members.
Failure to comply with any of the above will result in users being banned without notice. If any further details are needed, contact: “The team” using the link at the bottom of the forum page. Thank you.
User avatar
owla
Subtitles Admin
Posts: 43
Joined: Wed Oct 17, 2012 5:43 pm

SubtitleEditillä iso I -> pieni l muutos

Wed Mar 02, 2016 5:53 am

Riipatessani sarjoja yms. työläin yksittäinen vaihe on tämä iso I -> pieni l muutos. Oikoluku kyllä pysähtyy väärän ison I:n kohdalla ja lähes aina tarjoaa oikeaa l:ällä alkavaa sanaa, mutta isolla L:llä, vaikka sana keskellä lausetta. Joutuu kuitenkin muuttaman käsin pieneksi.

Nimimerkki eonmc2 tarjosi konstiksi, että käyttää:
Tämän takia otankin aina pois raksin OCR-ajon kohdasta "Kysy tuntemattomat sanat" ja korjaan virheet vasta myöhemmin Korjaa tavallisia virheitä -työkalulla.
"Korjaa tavallisia virheitä" kyllä löytää isot I ja korjaa ne pieneksi l:ksi, mutta silloin jää vaan monta muuta virhettä löytymättä ja joutuu ajamaan oikoluvun uudestaan!? (Ja silloin ei näy kuvaa fontista)

Miksi SE ei tarjoa OCR-ajossa pientä l:ää, vaikka tunnistaakin sanan oikein? Voisiko tämän saada ominaisuudeksi, vaikka jonkun valikon taakse?



_

eonmc2
Posts: 7
Joined: Wed Sep 17, 2014 8:04 pm

Re: SubtitleEditillä iso I -> pieni l muutos

Thu Mar 03, 2016 11:52 pm

Niin tuo on varsin ikävää ettei sitä fonttia näe kuin siinä alkuvaiheessa, olisi hyvä jos se pysyisi nähtävillä kaiken aikaa, samoin ne "Tuntemattomat sanat". Varsinkin vieraskielisten nimien kohdalla olisi hyödyllinen. Käyn yleensä välilyöntivirheet ja epäilyttävien nimien virheet läpi siinä ocr-ajovaiheessa selaamalla tuntemattomat sanat -listan läpi.

Auttaa hiukan jos "Korvaa monta toimintoa" -työkaluun syöttää ilman hakasulkeita "Huomioi kirjainkoko" moodissa seuraavat:

Code: Select all

[ lha] -> [ Iha] [ lsä] -> [ Isä] [ lso] -> [ Iso] [ ltä] -> [ Itä] [lrak] -> [Irak] [lran] -> [Iran] [ltali] -> [Itali] [lsrael] -> [Israel] [lrlan] -> [Irlan] [lntia] -> [Intia] [FBl] -> [FBI] [ClA] -> [CIA]
Näin ei tarvitse jokaista sijamuotoa käydä lävitse noista yleisistä sanan osista. Rivin alussa nuo pienet l:t korvautuvat isoksi I:ksi muistaakseni korjaustyökalulla, en nyt valitettavasti pääse kokeilemaan. Sen takia noissa ylemmissä on välilyönnit että ne korvautuisivat vain rivin alun jälkeen.

Noita "Korvaa monta toiminto" -tiedostoja voi viedä ja tuoda ohjelmaan ja niitä voi muuten käsitellä excelissä.
Excelissä muokattu lista tallennetaan XML-muodossa ja sitten tiedostopääte pitää muuttaa takaisin .templateksi

Tässä on minun varmuuskopiolistani: 2016-03-03.template

Code: Select all

https://mega.nz/#!M9czCRCR!Mzjnq2v05U50rEIxsiAksxiFwcVx-Tx16FDjMHpaGrw
Koitan käydä tuota listaa joskus läpi, siihen kun on kertynyt kaiken näköistä viime vuosien ajan.


edit.

Nuo perusmuodot eli Irak, Iran, Italia.. etc olen lisännytkin Options -> Settings -> Word lists -> OCR Fix listaan.
Mutta se ei löydä sitten muotoja Irakia, Irakissa, Irakista, Irakistako.. etc, joten silloin tuo "Korvaa monta" vaihtaa näissä erikoistatapauksien aluissa lrak[...] -> Irak[...]

Return to “Suomalaisten Tekstitys Foorumi”

Who is online

Users browsing this forum: No registered users and 3 guests