Page 1 of 1

Tekstien irroitus DVD tai matroska-filusta

Posted: Sat Feb 07, 2015 12:07 pm
by owla
Omat taitoni ei riitä varsinaiseen suomennokseen, mutta olen jo vuosia "harrastanut" tekstien ajastusta, lähinnä omaksi iloksi ja olen jokusen julkaisukkin. http://www.divxsubtitles.net/page_membe ... ?ID=563833

Viime aikoina olen riipannut tekstejä vanhemmista tv-sarjoista, joihin ei ole löytynyt irtotekstejä. Lähinnä Bones-sarjasta, koska haluan katsoa aikajärjestyksessä. Käytän TV:ssä PS3:sta, joka rantustelee mkv-filuja

Itse riippaus hoituu muutamassa minutissa, mutta oikoluettavaa jää vielä paljon. Itseäni häiritsee eniten:
-keskellä lausetta oleva pieni l näkyy isona I :nä, oikolukusanasto tarjoaa oikea sanaa, mutta isolla L:ällä !?
-alemmalla rivillä olevä iso Ä sotkee ylärivin (tälle ei taida voida tehdä mitään?)
-kursiivin (vino kirjasinlaji) käyttö sotkee tekstin, osa taitaa poistaa sen kokonaan, mutta minusta hyödyllinen esim. jos samalla rivillä eri puhuja, puhelintekstitys tai vierasperänen sana.
-nimisanasto, oikoluku pysähtyy silti kaikkiin sijamuotoihin.

Re: Tekstien irroitus DVD tai matroska-filusta

Posted: Tue Feb 10, 2015 5:53 pm
by eonmc2
SubtitleEditillä tuo iso I -> pieni l muutos hoituu "Korjaa tavallisia virheitä" -työkalulla (CTRL+Shift+F).
SE345FI on minulla käytössä: https://github.com/SubtitleEdit/subtitleedit/releases
isoI.gif
isoI.gif (69.6 KiB) Viewed 9678 times
On tosiaan rasittavaa, ettei ohjelmassa sijamuotoja huomioida automaattisesti (vieraskielisten) nimien yhteydessä OCR-ajossa, vaikka ne nimet olisikin lisännyt nimisanastoon.
Tämän takia otankin aina pois raksin OCR-ajon kohdasta "Kysy tuntemattomat sanat" ja korjaan virheet vasta myöhemmin Korjaa tavallisia virheitä -työkalulla.

Paljon toki riippuu tekstityksen fontista, esimerkiksi joskus joutuu Oikoluku-työkalulla korjaamaan virheellisiä ä- ja ö-kirjaimia a:ksi ja o:ksi ja jotkut o-kirjaimet c:ksi.
Usein Oikoluku-työkalu kylläkin tarjoaa oikeaa vaihtoehtoa virheelliselle sanalle, mikä nopeuttaa korjaamista huomattavasti.

Ja otsikkoon liittyen tiedoksi:
VSRip on kätevä sub/idx-filujen irroittamisessa (kunhan on ensin purkanut DVD:n kiintolevylle decrypterillä): http://www.videohelp.com/tools/VSRip
Mikäli tekstit ovat CC-tyyppisiä niin silloin irroitus onnistuu CCextractorilla: http://www.videohelp.com/tools/ccextractor

Re: Tekstien irroitus DVD tai matroska-filusta

Posted: Thu Mar 05, 2015 10:45 pm
by owla
Mitä eroa on riipatessa valinnoilla?:
Lisää nimi-/virheluetteloon (sama kirjaisinkoko)
Lisää käyttäjän sanastoon

Käytössä nyt SE345FI, (kiitti linkistä)

ilmeisesti molemmat valinnat kasvattavat omaa sanastoa!"? Miten jos joku paljon suomentanut/riipannut jakaisi sitä muille?