Page 1 of 1

Vague de mauvais sous-titres

Posted: Sat Feb 20, 2016 9:24 pm
by vankasteelj
Bonjour,

Depuis à peu près deux semaines, presque tous les épisodes de séries US que je regarde (en général 12-24-36h après leur sortie) ont des sous-titres francophones proposés via OpenSubtitles, mais ils sont TOUS mauvais. Pas mauvais dans le sens "google", mais mauvais dans le sens "traduit sans avoir vu l'épisode", avec un vocabulaire approximatif, des fautes de syntaxe, de grammaire et d'orthographe, certaines phrases parfois sans aucun sens. Bref, un "brouillon" de sous-titre, pas un sous-titre.

Je ne sais pas si c'est l’œuvre d'une personne ou d'un collectif, mais je trouve cela d'extrêmement mauvais goût, et ce serait intéressant qu'il/elle/ils/elles arrêtent de mettre en ligne des "rejetons d'abomination traduits à la va-vite".

Tout le monde peut accepter par moment certaines approximations ou quelques fautes, voire même une phrase ou deux non-traduites, mais des horreurs du genre:
- Mister Queen is the Green Arrow
- Monsieur la Reine est la flèche verte
- If you don't believe you can beat me, you never will.
- Si vous ne croyez pas que vous pouvez me battre, vous ne le sera jamais.
- And do not hesitate.
- Et ne pas hésiter.
C'est juste... abominable. Et pourtant, à moins que Google traduction n'ait fait de gros progrès, il me semble qu'il y a bel et bien un "travail" humain derrière ces sous-titres.

Une solution serait la bienvenue, mais à part manuellement aller commenter "c'est du caca" et mettre en ligne un fichier correct, ce qui prend une plombe, je ne vois pas trop.

Notez que je me plains principalement parce qu'à cause de ces mauvais sous-titres, c'est encore plus long que normal de mettre en ligne des sous-titres, puisqu'il ne faut pas "juste uploader", mais "retrouver le sous-titre + report + commenter + uploader".

Des bisous.

PS: des exemples - Vampire diaries s07e13, the 100 s03e05, Arrow s04e14

Re: Vague de mauvais sous-titres

Posted: Tue Feb 23, 2016 8:31 pm
by makkabe
Salut,
Pour avoir déjà vu ce type de "travail" (cf le "sous-titre" pour le dernier Star Wars) c'est du google translate à peine corrigé à la va-vite pour éviter d'être signalé comme une traduction automatique mais ça n'a de mon point de vue aucun intérêt en effet.

Re: Vague de mauvais sous-titres

Posted: Fri Feb 26, 2016 5:19 am
by Gautier
J'essaie d'y voir un peu plus clair. Ne peut-on pas distinguer deux cas? De la traduction automatique pur jus (Monsieur la Reine est la flèche verte), et puis des traductions qui souffrent de fautes d'ortographe ou d'une traduction approximative?

Alors les premiers peuvent être signalés et supprimés, alors que les deuxièmes peuvent être marqués comme "mauvais", éventuellement accompagné d'un commentaire. S'il s'agît de traductions automatiques retouchées, ça reste un travail automatique. Normalement assez facile d'identifier quelques phrases qui ne font aucun sens. Ou c'est plus compliqué que ça?

Re: Vague de mauvais sous-titres

Posted: Fri Feb 26, 2016 5:52 am
by vankasteelj
Je pense qu'il s'agit de traductions prises sur addic7ed, par exemple, pendant que la communauté là-bas est en train de traduire, on a juste mis les 20/40 dialogues sur 150 qui n'ont pas été traduits via Translate, et puis évidemment il n'y a eu aucune relecture derrière: c'est à chaud, c'est pas au point, ça s'articule mal (d'un traducteur à l'autre), etc.

Publié deux heures plus tard, quand les gens sur addic7ed on finalisé le sous-titre, ça serait de la qualité. Mais je me demande vraiment si pour les sous-titres dont je parle ici, il n'y a pas:
- soit un malheur d'upload automatique tout caca à cause de gens qui regardent des séries avec des sous-titres tout malades, avant qu'un sous-titre acceptable ne soit prêt.
- soit une sorte d'envie d'être le premier (pourquoi?) à n'importe quel prix.

Je ne sais pas, je n'ai pas les outils pour analyser ce genre de choses, mais je trouve que ça fait du mal à OS, parce que je suis toujours content quand je vois ma notification "un sous titre a été trouvé", et puis en fait... c'est irregardable. Et je pense à la foule de gens qui n'y connaissent rien qui doivent se dire que franchement internet c'est nul, parce qu'ils ne savent pas (ou n'y pensent même pas) qu'il est possible de trouver d'autres sous-titres, ailleurs, si nécessaire, ou qu'attendre X heures après la sortie d'un épisode garantit des sous-titres utilisables, etc.

Re: Vague de mauvais sous-titres

Posted: Sun Feb 28, 2016 9:49 pm
by Gautier
Oui, ok, mais à part de ce que j'ai déjà dit, on ne peut pas faire grand-chose hein. Marquer comme mauvais, et/ou supprimer. Sinon, d'autres idées?

Re: Vague de mauvais sous-titres

Posted: Sun Feb 28, 2016 10:36 pm
by vankasteelj
Est-ce que vous recensez les sous-titres supprimés car mauvais? Si oui, et si ce n'est pas anonymement mis en ligne, ça peut être intéressant de rappeler la personne à l'ordre, et/ou sanctions si nécessaires.

Si c'est de l'upload automatique, je pense notamment à BSPlayer que je vois partout, peut-être contacter le dev et lui demander de directement s'adresser à la sa communauté.

Niveau filtre, je pense que c'est malheureusement impossible tant que l'informatique "neuronale" ne se développe pas d'avantage, je pense qu'un ordinateur aujourd'hui ne peut pas faire la part entre bon et mauvais français.

Re: Vague de mauvais sous-titres

Posted: Tue Mar 01, 2016 10:42 pm
by Gautier
Pour la première question, oui, ça se fait déjà, mais, la plupart de ces uploads sont anonymes.

Pour le reste, il faut plutôt s'adresser aux autres admins je crois. Je suis plutôt nouveau ici, et je ne comprends pas toujours non plus pourquoi il y a tant d'uploads anonymes.

Re: Vague de mauvais sous-titres

Posted: Sun Apr 17, 2016 3:25 am
by Gautier
Rebonjour, je crois que j'ai trouvé la source de ces problèmes. J'avais remarqué qu'il y avait énormément d'uploads pour les nouvelles épisodes des séries américaines, mais alors toutes langues confondues, et du jour au lendemain de la sortie d'une épisode. Donc comme si toutes langues étaitent traduites en même temps. Et pour une très grande partie, des traductions automatiques ou bordéliques.

Alors la source du problème? Ce sont tous des uploads automatiques, pour la plupart fait par BSplayer. Un lecteur multimédia qui, à la lecture d'une vidéo, va automatiquement chercher des sous-titres sur trois sites différents, et qui ensuite va les redistribuer sur ces mêmes trois sites s'ils n'y sont pas encore présents. Le tout automatiquement, donc sans intervention humaine. Vous pouvez vous imaginer le problème, dès qu'il y a une connerie sur un site, tout le monde peut en profiter. Donc sous-titres automatiques, ou à 99% identiques, mauvais IMDb ID, sous-titres moitié faites, etcetera. Ca ne s'arrête pas et les problèmes ne font que se multiplier.

Il y a une vague de protestation parmi les admins pour arrêter ceci, mais il me semble qu'il y a de la résistance. En ce qui me concerne, si on ne ferme pas la porte à ces uploads automatiques de lecteurs, je ne vois pas pourquoi je tenterais de faire encore de l'administration sur le site. Si c'est juste pour faire le tri des déchêts qu'on a ramassé...

Re: Vague de mauvais sous-titres

Posted: Mon Apr 18, 2016 8:44 pm
by vankasteelj
Le problème n'est pas l'upload automatique, qui est bénéfique, mais plutôt des players qui font le téléchargement auto et l'upload auto.

Dans le player que j'ai écrit en HTML5, par exemple, le téléchargement se fait automatiquement si présent sur OpenSubtitles. S'il n'est pas présent ici, aucun sous-titre n'est téléchargé.

Et il faut aller chercher manuellement un sous-titre, qui est uploadé automatiquement si certaines conditions sont respectées :
- Il faut que le sous-titre ait au moins été joué pendant 70% du temps (réel, avancer à la fin n'uploadera pas, il faut avoir regardé avec les sous-titres présents)
- S'il y a eu le moindre changement avec le sous-titre (afficher -0.5s plus tôt, plus tard, etc), alors pas d'upload
- S'il y a la moindre erreur de décodage du sous-titre (encodage de caractères, timings qui se chevauchent, etc) alors pas d'upload

Ces conditions sont pourtant précisée (peut-être pas toutes, mais faut savoir utiliser son cerveau aussi) dans la documentation de l'API.

Plutôt que d'interdire l'upload automatique, je changerais les règles: si de nombreux (un ou deux, ça passe) sous-titres sont de qualité merdique, c'est probablement que la mise en place de l'upload automatique a été faite avec les pieds. Dans ce cas, bloquer l'UA du programme jusqu'à rectification de la part du développeur (il corrige le code et envoie une notification à OS quand la mise à jour est distribuée).

C'est un peu "hard" comme façon de faire, mais si les gens ne suivent pas les conditions écrites dans la doc, faut bien les obliger d'une façon ou d'une autre...

Re: Vague de mauvais sous-titres

Posted: Tue Apr 19, 2016 3:35 am
by Gautier
Je comprends, mais ce n'est pas ce qu'on constate dans la pratique. Dû à quoi, franchement, je ne le sais pas, car je crois que BSplayer a implementé certaines de ces règles aussi (peut-être pas toutes).

Mais ce qu'on constate:
- uploads sous le nom d'un autre film -> résultat: fichier uploadé avec les hash du mauvais film, donc après, pour le téléchargement, les utilisateurs seront trompés sur la marchandise
- uploads dans la mauvaise langue (mais vraiment mauvais, style arabe -> néerlandais)
- des semi-copies (style on change deux-trois charactères, on change un timing à gauche ou à droite) -> il y en a des tonnnnneeesssss comme ça, suffit qu'un seul charactère change, et hopla, on a un nouveau sous-titre
- carrément du n'importe quoi (prenez n'importe fichier texte, donnez-le le nom du film, et c'est go)
- et évidemment, nos amis, les traductions automatiques et/où moitié faites -> tu sais comment ça marche? un type veut absolument voir la toute dernière épisode de xyz le jour même de l'émission, il prend le fichier anglais, hocus-pocus google, et il regarde toute l'épisode avec ce fichier; conséquence, le player pense que c'est un bon fichier, et voili voilou, tout OS peut en profiter aussi (ps: le lendemain, son petit copain prend le fichier moitié fait sur addic7ed, et hoppa, on en a gagné encore un, le jour d'après, ... bon, tu as compris)

Dans la pratique, >90% des uploads automatiques sont pour la poubelle, voire plus. Sans blague. Réflechis un instant sur ce que tu viens de dire, et considère le mal que cette pratique peut faire. Voyons si tu seras encore du même avis.

Quelques super exemples:
- http://www.opensubtitles.org/en/search/ ... vie-412592: 4 uploads, dont un seul pour le bon film! (à l'origine il y en avais trois, le quatrième se cachait dans la section indonésienne)
- http://www.opensubtitles.org/en/search/ ... id-1804264 - vraiment une merveille, le césar de l'upload automatique - t'en penses quoi?

Re: Vague de mauvais sous-titres

Posted: Thu Apr 21, 2016 12:16 pm
by vankasteelj
http://www.opensubtitles.org/en/search/ ... ragent-ark

Mes uploads automatiques (sauf 2/3 qui n'ont pas été up par moi, va savoir pourquoi OS considère qu'il faut les ranger dans mon UA^^)

Autre similaire, basé plus ou moins sur le même code : http://www.opensubtitles.org/en/search/ ... orn%20time

À mon avis, c'est pas le système qui est mauvais, ce sont les codes. De toute façon avec un système automatique, tu ne peux pas avoir 100% de réussite, il manque le facteur humain, mais tu devrais pouvoir arriver à un solide 95-98% sans soucis.