Forum rules
Under no circumstances is spamming or advertising of any kind allowed. Do not post any abusive, obscene, vulgar, slanderous, hateful, threatening, sexually-orientated or any other material that may violate others security. Profanity or any kind of insolent behavior to other members (regardless of rank) will not be tolerated. Remember, what you don’t find offensive can be offensive to other members. Please treat each other with the kind of reverence you’d expect from other members.
Failure to comply with any of the above will result in users being banned without notice. If any further details are needed, contact: “The team” using the link at the bottom of the forum page. Thank you.
RallBauer1
Subtitles Admin
Posts: 20
Joined: Thu Jan 24, 2008 9:51 pm
Location: Germany

[DE] DVB-Untertitel

Mon Oct 27, 2014 10:50 pm

Hier mal eine Anleitung, wie man aus (digitalen) TV-Aufnahmen Untertitel extrahiert. Die Sender mischen verschiedene Arten von Informationen zu einem Datenstrom, dem sogenannten Stream, was landläufig Multiplexen heißt. Bei DVB-Streams finden sich dort neben Video- und Audio-Daten auch noch diverse Metadaten und eventuell Untertitel. Bevor es losgeht sollte man also sicherstellen, dass die entsprechende Aufnahme auch über Untertitel verfügt.

Im Digitalfernsehen können separat zur Bildinformation drei verschiedene Untertitel-Arten vorkommen:

• Variante 1: Fest (eingebrannte) Untertitel sind Teil des Videobildes und keine unabhängig gespeicherten Zusatzinformationen. // (häufig in der Programmvorschau an OmU, OmeU zu erkennen; UT können mit dieser Anleitung nicht erstellt werden)
• Variante 2: Untertitel aus Teletext
• Variante 3: In Bitmap-Grafiken verpackte Untertitel im DVB-Datenstrom


Variante 2
• für Teletext-Untertitel (Wo man Untertitel-Tafeln findet... Wikipedia - deaf-tv)
1. (ProjectX von watchers.net) laden, starten. Anschließend in den Reiter >EINSTELLUNGEN, >EINSTELLUNGEN und >AUSGABE wechseln. Hier sind je nach Bedarf Häkchen zu setzen (Mein Beispiel, siehe unteres Bild; Häkchen 1 ist für Telext-Untertitel und Häkchen 2 für Grafikuntertitel aus dem Datenstrom).
Image
2. Weitere Voreinstellungen >EINSTELLUNGEN, >EINSTELLUNGEN und >UNTERTITEL. (Mein Beispiel, siehe unteres Bild)
Image
3. Ich möchte von einer Aufnahme des Senders DAS ERSTE, die Teletext-Untertitel erhalten. Diese werden auf Tafel 150 angeboten. Das ZDF sendet im Übirgen auf Tafel 777! Zudem soll eine (einfarbige) SRT-Datei erzeugt werden (weitere - wie beispielsweise SSA, SUP oder SRT-C - sind ebenfalls möglich).

4. Los gehts ... wir laden die Aufnahme in ProjectX, wechseln in Reiter >SCHNITTSTEUERUNG und setzten zumindestens den ersten Schnittpunkt: den Startpunkt. Ein weiterer Schnittpunkt, das Ende der Aufnahme, muss nicht unbedingt gesetzt werden, da ProjectX diesen oftmals ignoriert und bis zum Ende demultiplext.
Image
5. Am linken Bildrand von ProjectX auf QUICKSTART DRÜCKEN. Im Unteren Beispiel sieht man, dass es eine Teletext-Ausstrahlung gibt und dass es DVB-Untertitel im STREAM gibt (PID: 0x0069(#6)({deu}_0x20_p1_a1 )

Code: Select all

+> Eingabedatei 0:  'C:\20140101 2000 - Das Erste - Beispiel.ts' (70.469.704 Bytes)
-> Dateityp ist TS (generic PES Container)
-> demultiplexe
...
Teletext:
PID: 0x0068({deu}_i100 )(#3)
Untertitel:
PID: 0x0069(#6)({deu}_0x20_p1_a1 )

und irgendwann ...

Code: Select all

Zusammenfassung der erstellten Mediendateien:
Teletext 00:   21 Seiten der Nr. 150      'C:\20140101 2000 - Das Erste - Beispiel[150].srt'
=> 1.645 Bytes geschrieben...
-> es wurden 5 Warn-/Fehlermeldungen ausgegeben.

6. Fertig. In meinem Beispiel wurde eine 21-zeilige-SRT-Datei aus dem Videotext erstellt. Die 5 Warn-/Fehlermeldungen können ignoriert werden.

Ehrlicherweise muss man sagen, dass UT des Öffentlich-rechtlichen Rundfunks nicht immer lippensynchron sind, diese aber auch nicht sein sollen. Wichtig ist einfach die Verständlichkeit und Lesbarkeit, so dass die Anzeigedauer oftmals höher ist, als beispielsweise auf einer DVD. Des Weiteren sind viele UT, sowohl im Teletext als auch im DVB-Stream farbig - was die (einfarbige) Nachbearbeitung erschwert.
Last edited by RallBauer1 on Fri Oct 31, 2014 12:00 pm, edited 4 times in total.

RallBauer1
Subtitles Admin
Posts: 20
Joined: Thu Jan 24, 2008 9:51 pm
Location: Germany

Re: [DE] DVB-Untertitel

Mon Oct 27, 2014 10:51 pm

Variante mit fest eingebrannten Untertiteln

Hierfür benötigen wir leider drei verschiedene Programme, da ich kein wirklich gutes kostenloses OCR-Programm gefunden habe, greif ich auf OmniPage 18 zurück.

VideoSubFinder
• OmniPage 18 bzw. ABBYY FineReader
Subtitle Edit


VideoSubFinder:
1. Damit VideoSubFinder auch kürzeste Textpassagen erkennt, müssen wir eine Einstellung ändern. Wir öffnen die Konfig-Datei in "/settings/general.cfg" und verändern die Variabel "vedges_points_line_error = 0.35" zu "vedges_points_line_error = 0.20". Speichern. Los geht's.

2. Nach dem Öffnen eines Videos, kann man die Anfangs- und Endzeiten mit einem Regler anpassen und/oder den Arbeitsbereich. Vor Arbeitsbeginn löschen wir alle Bilder aus vorangegangen Sitzungen mit >CLEAR FOLDERS und starten >RUN SEARCH. Nach und nach werden mögliche Texte im Video gefunden und im ORDNER RGBImages ausgegeben.
Hier kann man später die unnötigen Bilder löschen, bevor es in den nächsten Schritt geht.

3. IN > OCR > CREATE CLEARED TXT IMAGES geht's weiter. Hier werden aus den bunten Bildern, zeilenweise s/w-Bildchen für die leichtere Texterkennung. Sie landen im Ordner: TXTImages (hier bitte nichts löschen!!!).

    nun folgt als Zwischenschritt die Texterkennung - hier mit OmniPage 18 - bevor wir wieder mit VideoSubFinder weiterarbeiten.
    3.1 In OmniPage 18 gehen wir auf Datein laden und wählen Dateityp alle Dateien. (Evt. muss der Ordner TXTImages kurz verlassen und wieder betreten werden).
    3.2 Text-Erkennung startet.
    3.3 Im Anschluss werden die Ergebnisse gespeichert. Wir wählen Text (Dateityp .txt als unformatierter Text) und als Bennenungsoption verwenden wir die Eingabedateien. Zum Schluss noch Neue Datei für jede Bilddatei erstellen wählen und in den Ordner TXTResults speichern.

4. Im folgendem Schritt werden die zuvor ausgelesenen (zwei-zeiligen)-Texte wieder mit den Zeitstempeln zusammengefügt. ► Create Sub From TXT Results. Es entsteht: ► sub.srt. Fertig.


5. Die sub.srt aus dem VideoSubFinder Ordner öffnen wir nun mit Subtitle Edit, ändern die Kodierung auf Unicode (UTF-8) und korrigieren die vielen Fehler der OCR-Erkennung manuell. Ebenso vergessene Zeilen und unglückliche Timings...

6. Fertig.

Return to “General talk in other languages”

Who is online

Users browsing this forum: No registered users and 8 guests