Forum rules
Under no circumstances is spamming or advertising of any kind allowed. Do not post any abusive, obscene, vulgar, slanderous, hateful, threatening, sexually-orientated or any other material that may violate others security. Profanity or any kind of insolent behavior to other members (regardless of rank) will not be tolerated. Remember, what you don’t find offensive can be offensive to other members. Please treat each other with the kind of reverence you’d expect from other members.
Failure to comply with any of the above will result in users being banned without notice. If any further details are needed, contact: “The team” using the link at the bottom of the forum page. Thank you.
RallBauer1
Subtitles Admin
Posts: 25
Joined: Thu Jan 24, 2008 9:51 pm
Location: Germany

[DE] Anleitung: sub/idx-Dateien zu srt!

Sat Mar 16, 2013 8:00 pm

Da ich des Öfteren gefragt werde, wie man aus einem sub/idx-Paket eine .srt-Datei erstellt, hier zwei kleine Anleitungen (es gibt durchaus noch weitere). Vorweg ist anzumerken, dass es keine Ein-Klick-Lösung gibt; für wirklich gute (und auch korrekturgelesene Untertitel) ist ein wenig Zeitaufwand von Nöten.

Variante 1 (SubRip)
• für DVD-Untertitel geeignet (HD-Material liefert mit SubRip Fehler)
1. SubRip herunterladen, installieren und starten. Anschließend in den Reiter >OPTIONEN und >GLOBAL OPTIONS wechseln. Hier sind zwei Häkchen zu deaktivieren (siehe unteres Bild).
Image
2. Texterkennung starten. >DATEI >ÖFFNE VOB(S) >ÖFFNE IFO(S) [an letzter Stelle natürlich das entsprechende sub/idx-Paket wählen.]
3. START
4. Nach dem Durchlauf >KORREKTUREN >TEXTFEHLER NACH OCR ERKENNUNG KORRIGIEREN (siehe unteres Fenster)
Image
5. Datei SPEICHERN. Evt. müssen fehlerhafte Zeichenabstände angepasst werden; hier ist mit den Werten unter >OPTIONEN >OCR ERWEITERTES SETUP herumzuspielen. (Eines meiner Beispiele zeigt das untere Bild)
Image
6. Optional erfolgt eine Rechtschreibprüfung. Ideal ist dafür das kostenlose Programm SubtitleEdit mit Tesseract. (Eine Anleitung hierfür erspare ich mir, da ich zu tippfaul bin ...)
Die häufigste Fehlerkombinationen ist im Übrigen: lhr statt ihr.



Variante 2 (SubExtractor)
• für DVD-Untertitel und HD-Material geeignet.
1. SubExtractor herunterladen, installieren und starten. Anschließend den Reiter >FILE drücken und Auswahl >OPEN SUBTITLE FILE bestätigen (unser Ziel ist es, aus idx/subs eine srt-Datei zu machen).
2. mit BROWSE die entsprechende IDX-Datei auswählen und NEXT STEP DRÜCKEN.
Image
3. OCR (Texterkennung) beginnt. (Hierbei ist zu beachten, dass Buchstabenpaare getrennt werden müssen, ansonsten wird der angehängte Buchstabe nicht erkannt und ausgegeben!
Image
3.1 Zudem müssen bei speziellen Buchstaben des (deutschen) Alphabets - jene mit Umlauten - die horizontalen Doppelpunkte („Trema“) markiert werden!
Image
4. Im Anschluss erfolgt eine segenreiche Abfrage diverser "i" un "l"-Kombinationen. Somit ist eine kleine Rechtschreibprüfung gegeben.
5. Nachteilig ist jedoch, dass manchmal die Zeilenabstände nicht korrekt sind; diese passen wir bei > WORD SPACING ADJUSTMENT an)
Image
6. Speichern


(es ist mir bewusst, dass die Anleitung äußerst dürftig ist; aber wer ernsthaft .srt-Dateien erstellen will, der kommt ums Probieren nicht herum!)
Last edited by RallBauer1 on Thu Mar 08, 2018 12:31 am, edited 3 times in total.

User avatar
arcchancellor
Moderator
Posts: 202
Joined: Sat Apr 03, 2010 12:56 pm
Location: Ankh-Morpork

Re: [DE] Anleitung: sub/idx-Dateien zu srt!

Tue Mar 19, 2013 8:18 am

Danke für die knappe Zusammenfassung. Image
Es ist immer gut, wenn man interessierte User auf entsprechende Anleitungen verweisen kann.

Eine interessante und etwas umfassendere Instruktion älteren Datums zum Thema subs, die sich mehr auf andere Schwerpunkte bezieht, findet sich hier:
http://jthawk.uh-clan.de/?a=subtitle

Noch ein Tipp zu SubRip: Wer es viel nutzt (wie wohl z. B. wir beide ;-) ) kann sich die Arbeit außerdem erleichtern, indem er nach der erfolgten OCR die erkannten Zeichen nicht jeweils in eine neue Datei, sondern immer in dieselbe speichert.
Ich habe vor langer Zeit damit begonnen, mir eine "all-in-one.sum" anzulegen, die zwar mittlerweile einge Sekunden braucht, bis sie ins Programm geladen ist, aber den Erkennungsprozess dahingehend erleichtert, dass viele idx/subs fast ohne eigenes Zutun durchlaufen. Das funktioniert nicht mit jeder idx/sub (es gibt eben immer Ausreißer) und es entbindet natürlich auch nicht von einer anschließenden Fehlerkorrektur, wie den üblichen "I vs. L-Fehlern", beschleunigt und vereinfacht aber den Auslesevorgang.

Hat man sich beim Auslesen vertippt, so dass die OCR fortan ein Zeichen ständig falsch erkennt, kann man über View/Edit CharacterMatrix seine .sum laden und den Fehler in der Matrix berichtigen. Ab und zu ist es auch besser, auf die "all-in-one" zu verzichten und die OCR Zeichen für Zeichen neu abfragen zu lassen, aber in den allermeisten Fällen erspart das Speichern in ein und derselben Datei einges an Tipparbeit.

Lässt man die so oder so ausgelesenen subs anschließend noch durch die diversen Fehlerkorrekturprogramme des Subtitle Editors seiner Wahl durchlaufen, sind sie schon ganz gut vorbereitet.
"I don't believe in God. I just believe in Billy Wilder" - Fernando Trueba

Return to “General talk in other languages”

Who is online

Users browsing this forum: No registered users and 15 guests