Video Central

1. Zweck und Umfang

Diese Richtlinien legen die Qualitätsstandards und Best Practices von Prime Video für die Untertitelung aller Inhaltstypen und unterstützten Sprachen fest. Sie bieten Partnern wie Untertitelungsdiensten, Übersetzenden und Qualitätskontrolldiensten ein einheitliches Framework für die Bereitstellung hochwertiger Untertitel, die die kreative Absicht wahren und gleichzeitig die Erwartungen der globalen Zielgruppen erfüllen.

Prime Video bietet außerdem umfassende sprachspezifische Timed-Text-Lokalisierungs- und technische Styleguides für über 30 vorrangige Gebiete mit detaillierten Formatierungskonventionen, Groß- und Kleinschreibung, Zeichensetzungsspezifikationen und technischen Anforderungen, die auf die einzelnen Sprachen zugeschnitten sind. Diese Dokumente können im Bereich Sprachen, Lokalisation und Genres von Slate heruntergeladen werden. In den vorliegenden Richtlinien für Untertitelungen werden die universellen Prinzipien zusammengefasst, die in allen sprachspezifischen Styleguides verankert sind, und die grundlegenden Grundsätze, die der Qualität der Untertitelung bei Prime Video zugrunde liegen, näher erläutert. Zusammen bilden diese Ressourcen einen konzeptionellen Rahmen, der Lokalisierungsteams hilft zu verstehen, was Prime Video verlangt und warum diese Anforderungen wichtig sind, um Inhalte mit Untertiteln zu erstellen, die Sprachbarrieren überwinden und globalen Zielgruppen immersive Seherlebnisse bieten.

In der Regel sollten Untertitelungsteams die Timed-Text-Lokalisierungs- und technische Styleguides von Prime Video konsultieren, um detaillierte Anweisungen zu der Sprache zu erhalten, in die sie lokalisieren, und gleichzeitig die in diesen Richtlinien für Untertitelung dargelegten allgemeinen Prinzipien in ihre Arbeit integrieren.

2. Zentrale Qualitätsprinzipien

In den letzten Jahrzehnten hat sich die Untertitelung von einer rein technischen Praxis zu einer Disziplin entwickelt, die durch strenge akademische Forschung unterstützt wird. Forschende wie Díaz Cintas und Remael (2007), Chaume (2004), Titford (1982), Georgakopoulou (2009) und Pedersen (2011) haben umfassende Rahmenbedingungen für das Verständnis der Qualität von Untertitelungen entwickelt, während die Rundfunk- und Streamingbranche professionelle Standards eingeführt hat, die sowohl die technologischen Fähigkeiten als auch die Erwartungen der Zielgruppe widerspiegeln. Prime Video stützt sich auf diese Arbeit, um die Qualität der Untertitelung anhand zweier miteinander verbundener Dimensionen zu organisieren:

Übersetzung und Adaption konzentrieren sich auf die Erstellung von Untertiteln, die die Bedeutung genau und authentisch vermitteln und gleichzeitig die dem Medium innewohnenden Einschränkungen respektieren. Dazu gehören die Wahrung von Prägnanz und Genauigkeit, die Gewährleistung der Lesbarkeit durch Verkürzung und Vereinfachung, die Gewährleistung einer einheitlichen Terminologie, die Vermeidung übermäßig wörtlicher Übersetzungen und die angemessene Anpassung kultureller Referenzen. Untertitelende müssen den Respekt vor dem Ausgangsmaterial mit der Schaffung natürlicher Dialoge in der Zielsprache abwägen, die die Zielgruppen innerhalb der Grenzen des Bildschirmtextes verarbeiten können.

Technischen Anforderungen legen Standards für die Präsentation von Untertiteln fest, die es ermöglichen, Inhalte mit Untertiteln nahtlos in das Seherlebnis zu integrieren. Dazu gehören Synchronisations- und Timing-Spezifikationen, Parameter für die Lesegeschwindigkeit, Untertiteldauer, Richtlinien zur Zeilenbehandlung und Positionierung sowie Konventionen für Zeilenumbrüche. Diese technischen Elemente stellen sicher, dass Untertitel lesbar, zugänglich und unauffällig sind.

Diese beiden Dimensionen arbeiten zusammen, um sicherzustellen, dass Untertitel ihren grundlegenden Zweck erfüllen: Dem Publikum die Möglichkeit geben, sich voll und ganz auf Inhalte einzulassen, die ursprünglich in einer anderen Sprache produziert wurden.

3. Übersetzung und Adaption

Untertitelung stellt eine einzigartige Übersetzungsherausforderung dar: Umwandlung von gesprochenen Dialogen in schriftlichen Text, den das Publikum innerhalb strenger räumlicher und zeitlicher Einschränkungen lesen, verarbeiten und verstehen kann. Im Gegensatz zu anderen Übersetzungsformen arbeiten Untertitelende in einem Medium, in dem der Platz auf dem Bildschirm begrenzt ist, die Lesezeit durch das Tempo der audiovisuellen Inhalte festgelegt wird und das Publikum visuelle Informationen, Audioelemente und geschriebenen Text gleichzeitig verarbeiten muss. Dieses Umfeld erfordert Übersetzungsstrategien, bei denen Prägnanz und Lesbarkeit im Vordergrund stehen und gleichzeitig die semantische Genauigkeit, die narrative Kohärenz und die emotionale Wirkung gewahrt bleiben.

Daher ist es eine wichtige Anforderung, dass die Erstellung und Qualitätsprüfung von Inhalten mit Untertiteln immer zusammen mit dem Ansehen des Videos durchgeführt werden müssen. Dadurch wird sichergestellt, dass Zeit-, Kontext- und visuelle Informationen sowie andere Leistungselemente, die als Grundlage für Übersetzungsentscheidungen dienen, angemessen bewertet werden können.

3.1 Prägnanz und Treue

Die Umgebung der Untertitelung stellt besondere Einschränkungen für die Übersetzungsarbeit dar. Wie Titford feststellte, prägen sowohl räumliche als auch zeitliche Einschränkungen grundlegend jede sprachliche Entscheidung, die Untertitelende treffen. Im Gegensatz zu anderen Übersetzungsformen müssen Untertitelende das Bedürfnis nach semantischer Genauigkeit gegen die physische Realität des Bildschirmraums und den zeitlichen Fluss audiovisueller Inhalte abwägen. Diese Einschränkung ist keine Einschränkung, die es zu überwinden gilt, sondern ein charakteristisches Merkmal des Mediums, das strategische Ansätze zur Textverkürzung und Anpassung erfordert.

Die größte Herausforderung für den Untertitelende besteht darin, zu bestimmen, welche Informationen unbedingt bewahrt werden müssen und welche komprimiert oder weggelassen werden können, ohne das Verständnis der Handlung oder die emotionale Wirkung zu beeinträchtigen. Dies erfordert eine kontinuierliche Bewertung der Relevanz und des erzählerischen Werts: Um zu verstehen, welche Elemente die Geschichte vorantreiben und welche ergänzenden Zwecken dienen.

Um dieses Ziel zu erreichen, verlassen sich Untertitelende stark auf Verkürzungsstrategien. Georgakopoulous Forschung identifiziert 2 Haupttypen: die partielle Verkürzung oder Zusammenfassung, die auf einer präziseren Wiedergabe des Originals beruht, und die vollständige Reduzierung oder Löschung, die durch das Weglassen eines Teils der Quellnachricht erreicht wird. Beide Ansätze dienen demselben Zweck: Das Publikum soll den Inhalt der Untertitel innerhalb der verfügbaren Zeit bequem lesen und verarbeiten können, während gleichzeitig alle Informationen erhalten bleiben, die zum Verständnis der Handlung erforderlich sind. 

Zum Beispiel werden in gesprochenen Dialogen häufig Wörter wie „Du weißt schon“, „nun“, „okay“ und „gefällt mir“ verwendet, zusammen mit der Gewohnheit, Sätze mit „und“ zu beginnen. Wenn diese Wörter eher als Füllwörter dienen und weniger als aussagekräftiger Inhalt, sollten sie in den Untertiteln weggelassen werden. Ebenso sollten Verzögerungslaute wie „ähm“, „öhm“, „hm“ und „ah“ bei der Übersetzung nach Möglichkeit vermieden werden, da sie die Lesebelastung erhöhen, ohne einen semantischen Wert zu bieten. Diese Auslassungen sind eine praktische Anwendung des Prinzips der Prägnanz: Text entfernen, der nicht dem narrativen Verständnis dient.

3.2 Einheitlichkeit und Kohärenz

Einheitlichkeit dient sowohl dem Verständnis als auch der Kohärenz. Untertitelende müssen Terminologie, Charakternamen, Fachvokabular und wiederkehrende Phrasen im gesamten Inhalt einheitlich behandeln, um dem Publikum zu helfen, das Gesamtverständnis zu verbessern, anstatt sie zu zwingen, verschiedene Übersetzungen desselben Konzepts miteinander in Einklang zu bringen.

Untertitel sollten auch so strukturiert sein, dass sie „semantisch und syntaktisch in sich geschlossen“ sind, wie von Díaz Cintas und Remael feststellen. Das bedeutet, dass jede Untertiteleinheit für sich genommen Sinn machen sollte, wobei Wörter, die durch Logik, Semantik oder Grammatik eng miteinander verbunden sind, nach Möglichkeit gruppiert werden sollten. Dadurch wird sichergestellt, dass das Publikum jeden Untertitel während seines kurzen Auftritts auf dem Bildschirm als kohärente Einheit verarbeiten kann, anstatt sich mit fragmentierten Informationen über mehrere Untertitelereignisse hinweg abmühen zu müssen.

3.3 Kulturelle Anpassung

Forschende wie Pedersen haben „extralinguistische kulturelle Referenzen“ als besonders herausfordernde Bereiche für Übersetzungen identifiziert. Diese lexikalischen Elemente, die sich auf Personen, Gastronomie, Bräuche, Orte und Organisationen beziehen, sind tief in der Ausgangskultur verankert und für das Zielpublikum möglicherweise völlig unbekannt. Untertitelende müssen anhand ihrer erzählerischen Funktion und der Wahrscheinlichkeit, dass sie erkannt und verstanden werden, entscheiden, ob sie beibehalten, angepasst oder ersetzt werden sollen.

Die meisten dieser kulturellen Referenzen, darunter Slogans, Wortspiele, beliebte Zitate und idiomatische Ausdrücke, erfordern eine Transkreation, um sicherzustellen, dass beim Zielpublikum ähnliche emotionale Reaktionen hervorgerufen werden. Anstatt wörtlich zu übersetzen, sollten Untertitelende diese Elemente an ihre Funktion und beabsichtigte Wirkung in der Ausgangssprache anpassen, um die entsprechende Resonanz in der Zielkultur zu erzielen.

Diese Gestaltungsfreiheit ist jedoch mit wichtigen rechtlichen Grenzen verbunden. Untertitelende dürfen niemals offizielle Übersetzungen kopieren: Alle direkten Zitate aus Gedichten, Büchern und anderen veröffentlichten Werken müssen übersetzt oder von Grund auf neu erstellt werden, mit Ausnahme von Zitaten aus der Bibel oder anderen Werken, die nicht urheberrechtlich geschützt sind. Dadurch wird sichergestellt, dass die Untertitelinhalte von Prime Video die geistigen Eigentumsrechte respektieren und gleichzeitig die Übersetzungsqualität beibehalten.

3.4 Lesbarkeit und natürlicher Ausdruck

In fiktiven Inhalten wie Filmen und Fernsehsendungen versuchen Dialoge, natürlich zu klingen, indem sie alltägliche Konversationen nachahmen, aber sie wurden von Drehbuchautoren sorgfältig ausgearbeitet: ein Phänomen, das Chaume „vorgefertigte Oralität“ nennt. Untertitelende müssen diese geskriptete Sprache in geschriebenen Text umwandeln, der sich auf natürliche Weise liest und schnell verarbeitet wird.

Wenn es die Lesbarkeit erfordert, sollten Untertitelende lange und komplexe Phrasen durch kürzere und einfachere Alternativen verdichten, ersetzen oder paraphrasieren. Eine Vereinfachung darf jedoch niemals auf Kosten der semantischen Vollständigkeit gehen. Alle notwendigen Bedeutungselemente müssen erhalten bleiben, ebenso der Originalton und das Original-Sprachniveau des Quelldialogs. 

Wie bereits erwähnt, werden bei der wörtlichen Wort-für-Wort-Übersetzung häufig die beabsichtigte Bedeutung, kulturelle Nuancen oder idiomatische Ausdrücke nicht korrekt wiedergegeben. Untertitelende sollten etablierte oder standardisierte zielsprachliche Ausdrücke verwenden, insbesondere für Redewendungen und Metaphern, umgangssprachliche Ausdrücke und Umgangssprache sowie Sprichwörter und Redewendungen. Bei Wortwitzen und Wortspielen sollte ein gleichwertiger Effekt in der Zielsprache nachgebildet werden, anstatt den Witz in der Ausgangssprache zu erklären.

3.5 Ton und Sprachniveau

Der Tonfall in den Untertiteln muss die Absicht und Leistung der Quellversion widerspiegeln. Untertitelende sollten Vortragsweise, Kontext und Beziehungsdynamik der sprechenden Person sorgfältig analysieren, um das beabsichtigte emotionale Sprachniveau und die soziale Positionierung in der Zielsprache genau zu vermitteln.

Dazu gehört auch die Wahrung des Formalitätsniveaus und des sozialen Sprachniveaus, also der Unterscheidungen zwischen formellen, informellen und intimen Sprachmustern, die Machtdynamiken, soziale Hierarchien oder zwischenmenschliche Beziehungen signalisieren. Es erfordert auch, emotionale Intensität und Affekt aufrechtzuerhalten und sicherzustellen, dass der Grad der Emotionen, der durch Wortwahl, Syntax und rhetorische Mittel vermittelt wird, Wut, Freude, Sarkasmus oder Zärtlichkeit mit gleicher Wirkung hervorruft. Darüber hinaus müssen Untertitelende charakterspezifische Sprachmuster und Idiolekte erfassen, darunter individuelle sprachliche Macken, verbale Gewohnheiten, Schlagworte oder unverwechselbares Vokabular, das die Stimme einer Figur definiert und zur Charakterisierung beiträgt.

Wenn im Original Dialekte verwendet werden, sollten Untertitelende diese nach Möglichkeit in der Übersetzung beibehalten und in der Zielsprache äquivalente regionale oder soziale Dialekte finden, die ähnliche kulturelle und soziale Informationen vermitteln. Das Ziel ist nicht die phonetische Transkription, sondern die Erhaltung der soziolinguistischen Funktion, die der Dialekt in der Erzählung erfüllt, unabhängig davon, ob es um die geografische Herkunft, die soziale Klasse, das Bildungsniveau oder die Gruppenzugehörigkeit geht. Wo direkte Dialekt-Äquivalente nicht existieren oder zu Verwirrung führen würden, können Untertitelende andere sprachliche Strategien wie lexikalische Entscheidungen, Syntaxvariationen oder Sprachniveau-Verschiebungen anwenden, um sich den sozialen und kulturellen Merkmalen des ursprünglichen Dialekts anzunähern.

4. Technische Anforderungen

Technische Anforderungen legen die Präsentationsstandards fest, die es ermöglichen, dass sich Inhalte mit Untertiteln nahtlos in das Seherlebnis integrieren lassen. Diese Spezifikationen umfassen Synchronisation und Timing, Parameter für Lesegeschwindigkeit, Dauer, Zeilenbehandlung und Positionierungskonventionen.

4.1 Synchronisation

Das Timing der Untertitel wirkt sich direkt darauf aus, wie das Publikum Qualität wahrnimmt. Díaz Cintas und Remael argumentieren, dass Synchronisation möglicherweise der Hauptfaktor ist, der die Wertschätzung des Publikums für Inhalte mit Untertiteln beeinflusst. Wenn Untertitel genau zu dem Zeitpunkt erscheinen, an dem die Charaktere zu sprechen beginnen, und verschwinden, wenn sie fertig sind, kann das Publikum leicht erkennen, wer was sagt. Wenn Untertitel jedoch zu früh oder zu spät erscheinen oder lange nach Ende des Dialogs auf dem Bildschirm bleiben, kann das Seherlebnis stark gestört werden. Die Untertitel sollten innerhalb von 3 Frames auf den Ton abgestimmt sein, um den Rhythmus des Inhalts und die Darstellungsweise der Sprechenden widerzuspiegeln. Dieser Synchronisationsprozess, der auch als Spotting, Cueing, Timing oder Origining bezeichnet wird, kann von Übersetzenden oder von Fachpersonen durchgeführt werden, die mit Timing-Software, -Techniken und -Spezifikationen vertraut sind. Beim Erkennen müssen Pausen, Unterbrechungen und andere prosodische Merkmale berücksichtigt werden, die die ursprüngliche Rede charakterisieren.

Für Dialoge, die über Schnittwechsel hinausgehen, gelten spezielle Frame-genaue Timing-Konventionen. Wenn der Dialog innerhalb von 3 Frames nach einem Schnittwechsel beginnt, sollte die In-Time an den Shot-Wechsel angepasst werden. Wenn der Dialog innerhalb von 3 Frames nach einem Schnittwechsel endet, sollte die Out-Time vor dem Shot-Wechsel auf 2 Frames zurückgezogen werden. Wenn es 1 Untertitel vor und 1 Untertitel nach dem Schnittwechsel gibt, sollte der 1. Untertitel 2 Frames vor dem Schnittwechsel enden und der 2. Untertitel sollte mit dem Schnittwechsel beginnen.

Die Timing-Konventionen können je nach Sprache variieren. Im Japanischen zum Beispiel sollte die Out-Time auf den Schnittwechsel selbst zurückgezogen werden und nicht auf 2 Frames davor, wenn der Dialog innerhalb von 3 Frames nach einem Schnittwechsel endet und unmittelbar danach kein Untertitel erscheint. Wie immer sollten Untertitelende die Styleguides für zeitgesteuerten Text von Prime Video lesen, um sicherzustellen, dass die sprachspezifischen Timing-Anforderungen eingehalten werden.

4.2 Lesegeschwindigkeit

Die zweite wichtige Einschränkung, die sich auf die Textmenge auswirkt, die in einer Untertitelung enthalten sein kann, ist die angenommene Lesegeschwindigkeit des Publikums. Die Festlegung angemessener Lesegeschwindigkeit stellt eine Herausforderung dar, da die Lesefähigkeit der Zielgruppen stark variiert und das Verständnis von der Komplexität des Wortschatzes, der Syntax und der Handlung auf dem Bildschirm abhängt.

Da keine einzige Lesegeschwindigkeit für alle geeignet ist, hat die Branche mehrere Ansätze entwickelt. Das Rundfunkfernsehen stützt sich traditionell auf das, was Díaz Cintas und Remael als „6-Sekunden-Regel“ beschreiben: 2 vollständige Zeilen mit jeweils etwa 35 Zeichen (insgesamt 70 Zeichen) sollten innerhalb von 6 Sekunden lesbar sein. Bei diesem Ansatz wird davon ausgegangen, dass 2 Frames audiovisueller Inhalte 1 Zeichen Platz für Untertitel zulassen, was eine Lesegeschwindigkeit von 12 Zeichen pro Sekunde (cps) oder ungefähr 130 Wörtern pro Minute (wpm) ergibt.

Obwohl diese Formel im Rundfunk nach wie vor üblich ist, haben viele Streaming-Plattformen höhere Lesegeschwindigkeit eingeführt. Sie argumentieren, dass das zeitgenössische Publikum eher daran gewöhnt ist, Texte auf dem Bildschirm zu lesen als frühere Generationen und daher Untertitel schneller verarbeiten kann. Folglich sind Lesegeschwindigkeit von 15 cps (160 wpm) ziemlich normal geworden, wobei einige Plattformen 17 cps (180 wpm) oder sogar höhere Lesegeschwindigkeit für bestimmte Inhaltstypen zulassen.

Prime Video legt je nach Inhaltstyp unterschiedliche Standardlesegeschwindigkeit fest: Programme für Erwachsene sollten ein Maximum von 17 Zeichen pro Sekunde anstreben, während Programme für Kinder ein Maximum von 13 Zeichen pro Sekunde anstreben sollten. Wenn die maximale Lesegeschwindigkeit von 17 Zeichen pro Sekunde nicht erreicht werden kann, können bestimmte Anpassungen vorgenommen werden. Wenn der Text nicht komprimiert werden kann und aufgrund der Anforderungen an die Lesegeschwindigkeit zusätzliche Zeit benötigt wird, kann die Ausfallzeit bis zu einer halben Sekunde (12 Frames) nach dem Ende des Audios verlängert werden, sofern der Untertitel dadurch nicht über einen Schnittwechsel hinausgeht. Ist dies nicht möglich, sollte der Untertitel komprimiert werden, ohne die beabsichtigte Bedeutung der Quelle zu verändern oder zu verlieren. Alternativ können Untertitel zusammengeführt oder aufgeteilt werden, um die Lesegeschwindigkeit zu erhöhen. Als letzten Ausweg kann die Lesegeschwindigkeit auf bis zu 22 Zeichen pro Sekunde erhöht werden.

Die Standards für die Lesegeschwindigkeit variieren je nach Sprache erheblich, was auf Unterschiede in der Schriftdichte, der Zeichenkomplexität und den Lesegewohnheiten des Publikums zurückzuführen ist. Japanisch verwendet beispielsweise 4 cps sowohl für Programme für Erwachsene als auch für Kinder, wohingegen indische Sprachen 22 cps für Erwachsene und 18 cps für Kinder verwenden. Auch hier sollte immer auf die sprachspezifischen Styleguides von Prime Video Bezug genommen werden, um die für die jeweilige Sprache geltenden Anforderungen an die Lesegeschwindigkeit zu ermitteln. 

4.3 Dauer

Die Dauer der Untertitel wirkt sich direkt auf die Lesbarkeit und den Komfort des Publikums aus. Die Verweildauer eines Untertitels auf dem Bildschirm hängt zwar letztlich von der Geschwindigkeit ab, mit der der Dialog wiedergegeben wird, aber die Festlegung von Mindest- und Höchstwerten für die Dauer gewährleistet eine gleichbleibende Bildqualität.

Um zu verhindern, dass Untertitel auf dem Bildschirm aufblitzen, und um sicherzustellen, dass das Publikum ausreichend Zeit hat, den Inhalt zu lesen, sollte die Mindestdauer etwa fünf Sechstel Sekunden pro Untertitelung betragen. Dies entspricht 20 Frames für Inhalte mit 24 Frames pro Sekunde, 21 Frames für 25 Frames pro Sekunde und 25 Frames für 30 Frames pro Sekunde. Andererseits sollten Untertitel nicht länger als nötig auf dem Bildschirm bleiben, da sonst die Gefahr besteht, dass das Publikum den Text erneut liest. Um dies zu vermeiden, sollte die maximale Dauer pro Untertitel 7 Sekunden betragen. Daher sollten Zeiträume, die länger als 7 Sekunden sind, beim Erkennen von Inhalten in kleinere Einheiten aufgeteilt werden.

Zwischen fortlaufenden Untertiteln sollte ein Mindestabstand von 2 Frames eingehalten werden. Dieses kurze Intervall stellt sicher, dass das Publikum zwischen einzelnen Untertiteleinheiten unterscheiden kann, und verhindert, dass der Text als aufblitzender Text wahrgenommen wird.

In rasanten Dialogen, in denen sich mehrere Personen ohne Pausen gegenseitig unterbrechen, ermöglichen japanische Untertitel eine kürzere Dauer als das Standardminimum. Es sollten jedoch niemals weniger als 10 Frames sein, um ein Aufblitzen zu vermeiden. Wenn diese Einschränkung nicht eingehalten werden kann, müssen linguistische Fachkräfte priorisieren, welcher Dialog untertitelt werden soll, da japanische Untertitel keine doppelten Sprechenden unterstützen.

4.4 Zeilenbehandlung und Positionierung

Das zuvor erörterte Prinzip der semantischen und syntaktischen Selbstbegrenzung führt zu spezifischen technischen Anforderungen für die Präsentation von Untertiteln. Sowohl die Aufteilung des Dialogs auf mehrere Untertitel als auch die Zeilenumbrüche innerhalb einzelner Untertitel sollten idealerweise einem logischen und grammatikalischen Bruch im Dialog entsprechen. Das bedeutet, dass Wörter, die durch Logik, Semantik oder Grammatik eng miteinander verbunden sind, in Gruppen zusammengefasst werden sollten, um Spaltungen zu vermeiden, die Artikel von Substantiven, Adjektive von den Wörtern, die sie modifizieren, oder Verben von ihren Subjekten trennen. Auf diese Weise kann das Publikum Untertitel kohärent verarbeiten und es wird verhindert, dass Informationen über mehrere Untertitel hinweg fragmentiert werden.

Untertitel sollten außerdem auf maximal 2 Zeilen pro Untertitel beschränkt sein, mit nicht mehr als 42 Zeichen pro Zeile, und sie sollten immer auf eine einzige Zeile beschränkt werden, es sei denn, es ist eine Pause zur Klarstellung oder zum Stil erforderlich.

In Bezug auf die Positionierung sollten die Untertitel mittig ausgerichtet und am unteren Bildschirmrand platziert werden. Befindet sich im unteren Bildschirmdrittel Text (z. B. Abspann oder Forced Narratives), sollten die Untertitel nach oben verschoben werden. In Fällen, in denen eine Überlappung des Bildschirmtextes nicht zu vermeiden ist, sollte die Option gewählt werden, die das Publikum am wenigsten stört. Wenn sowohl der Text auf dem Bildschirm als auch das Gesicht der sprechenden Person nicht vermieden werden können, empfiehlt es sich, den Text auf dem Bildschirm nicht zu verdecken.

Die Konventionen zur Behandlung von Zeilen variieren je nach Sprache, einschließlich spezifischer Regeln für die Zeilenteilung, zusammengesetzte Substantive, Artikel, Adjektive und bevorzugte Zeilenlängenverhältnisse. Japanisch verwendet beispielsweise 13 Zeichen pro Zeile für horizontale Untertitel und 11 Zeichen pro Zeile für vertikale Untertitel, wohingegen Thailändisch 37 Zeichen pro Zeile verwendet. Weitere Informationen finden Untertitelende in den sprachspezifischen Styleguides von Prime Video.

5. Spezialisierter Inhalt

In den Abschnitten Übersetzung und Adaption und Technische Anforderungen werden zwar die grundlegenden Prinzipien festgelegt, die für alle Arbeiten mit Untertiteln gelten, aber bestimmte Fachinhalte stellen besondere Herausforderungen dar, die eine differenzierte Behandlung erfordern, bei der beide Aspekte berücksichtigt werden müssen. Dieser Abschnitt enthält Anleitungen für den Umgang mit diesen spezifischen Elementen, um sicherzustellen, dass die Qualitätsstandards bei allen Untertitelarbeiten einheitlich eingehalten werden.

5.1 Titel

Wenn der Haupttitel einer Fernsehserie oder eines Films auf dem Bildschirm erscheint, hängen die Anforderungen an die Untertitelung davon ab, ob es sich bei dem Inhalt um eine Neuveröffentlichung oder einen Katalogtitel handelt. Bei Neuerscheinungen sollte der Haupttitel nicht untertitelt werden, sofern nicht anders angegeben.

Für Katalog- oder Bibliothekstitel variieren die Anforderungen an die Untertitelung je nach Sprache. Wenn ein Untertitel erforderlich ist, sollte der Haupttitel weggelassen werden, wenn die Quellversion vollständig der von Prime Video für die Zielsprache bereitgestellten genehmigten Übersetzung entspricht. Wenn der Haupttitel von Grund auf neu übersetzt wird, sollten alle lokalisierten Versionen des vorhandenen geistigen Eigentums (IP) beibehalten werden. Die weitere Richtung der Lokalisierungsbehandlung wird durch die Kampagnenstrategie bestimmt. Die Methoden zur Übersetzung von Haupttiteln sind je nach Sprache sehr unterschiedlich. Daher solltest du immer die zeitgesteuerten Text-Styleguides von Prime Video konsultieren, um sprachspezifische Anweisungen zu erhalten.

Wenn Staffeltitel auf dem Bildschirm erscheinen, sollten sie nur übersetzt und untertitelt werden, wenn sie eine Nummerierung enthalten (z. B. „Staffel 3“) oder vom Haupttitel der Serie abweichen. Episodentitel sollten immer übersetzt und untertitelt werden, wenn sie auf dem Bildschirm gezeigt werden, und sie können ohne Einschränkungen direkt lokalisiert werden, aber die Einheitlichkeit zwischen den Metadaten und den Untertitel-Assets sollte immer gewahrt bleiben.

5.2 Forced Narrative und Bildschirmtext

Für alle handlungsrelevanten Bildschirmtexte sollten Untertitel zur Verfügung gestellt werden, einschließlich des narrativen Textes (der Teil der Hauptfotografie ist) und des Burn-in-Textes (der bei der Nachbearbeitung hinzugefügt wurde). Wenn die Kamera bewusst auf ein bestimmtes Element fokussiert, ist dies ein Hinweis darauf, dass es für die Handlung relevant ist, und ein narrativer Untertitel sollte vorhanden sein. Wenn Forced Narrative jedoch mit dem Text auf dem Bildschirm identisch ist, in einem Dialog behandelt wird oder im gesamten Inhalt wiederholt vorkommt, sollte sie weggelassen werden, um Redundanzen zu vermeiden. Wenn sich der Bildschirmtext und seine Übersetzung nur durch Akzentzeichen unterscheiden (z. B. „Berlin“ vs. „Berlín“), kann die linguistische Fachkraft entscheiden, ob der Untertitel gesetzt oder als überflüssig behandelt wird, je nachdem, ob der Akzentunterschied signifikant genug ist, um einen Untertitel zu rechtfertigen.

Was die Positionierung anbelangt, so sollten Forced Narratives so platziert werden, dass sie den Text auf dem Bildschirm in der Ausgangssprache oder das Gesicht der sprechenden Person nicht verdecken. Wenn beides unvermeidlich ist, ist es vorzuziehen, den Text auf dem Bildschirm nicht zu verdecken. 

Wenn Forced Narratives für den Bildschirmtext den Dialog unterbrechen, gelten spezielle Formatierungskonventionen, um Kontinuität und Lesbarkeit zu gewährleisten. Die Standardbehandlung besteht darin, am Ende des vorhergehenden Untertitels und am Anfang des folgenden Untertitels eine Ellipse zu verwenden, um die Unterbrechung anzuzeigen. Dies hilft dem Publikum zu verstehen, dass der Dialog fortgesetzt wird, nachdem die Forced Narrative erscheint. Darüber hinaus sollten Forced Narratives bei derselben Einheit niemals mit Untertiteln kombiniert werden: Sie müssen aus Gründen der Klarheit und Lesbarkeit immer separat erscheinen.

Die Behandlung von Ellipsen, wenn eine Forced Narrative den Dialog unterbricht, ist je nach Sprache unterschiedlich. Zum Beispiel verwendet Tschechisch in diesem Zusammenhang keine Auslassungszeichen, und Japanisch verwendet vertikale Positionierung mit asynchronem Timing anstelle von Ellipsen, um eine Unterbrechung des Dialoguntertitels zu vermeiden. Weitere Informationen finden Untertitelende in den sprachspezifischen Styleguides von Prime Video.

5.3 Namen

Die Behandlung von Eigennamen ist je nach Sprache sehr unterschiedlich. Einige Sprachen übertragen Eigennamen in ihr Schriftsystem, während andere die ursprüngliche Schreibweise beibehalten, einschließlich diakritischer Zeichen und Akzente.

Wenn Eigennamen aus kreativen Gründen lokalisiert werden müssen, sollten Übersetzende sicherstellen, dass alle Untertitel-Assets mit dem synchronisierten Audio der entsprechenden Sprachen übereinstimmen, sofern zutreffend. Spitznamen sollten nur übersetzt werden, wenn sie eine bestimmte Bedeutung vermitteln oder wenn sie bekannt sind und anerkannte Entsprechungen in der Zielsprache haben. Bei historischen oder mythischen Charakternamen sollten Untertitelende immer auf etablierte oder bekannte Übersetzungen zurückgreifen.

Für Markennamen sollte die offizielle lokalisierte Version verwendet werden. Falls nicht verfügbar, sollte der Markenname auf Englisch übernommen oder in die entsprechenden Sprachen transliteriert werden. Wenn eine Marke im Zielgebiet jedoch nicht bekannt ist, sollte das Produkt mit einem Oberbegriff anstelle des Markennamens beschrieben werden, um sicherzustellen, dass das Publikum die Bedeutung versteht. Bei fiktiven Marken sollte die Lokalisierung je nach kreativer Absicht durch Übersetzung oder Transliteration des Inhalts erreicht werden.

5.4 Ausländischer Dialog

Für jeden Dialog, der in einer anderen Sprache als dem Originalaudio gesprochen wird, sollte eine Übersetzung bereitgestellt werden, wenn der Inhalt für das Publikum verständlich sein soll. In diesen Fällen wird der ausländische Dialog in der Regel auch in der Originalversion untertitelt. 

Fremdwörter, Ausdrücke oder Phrasen sollten übersetzt oder transliteriert werden, wenn keine etablierte Übersetzung vorliegt. Rechtschreibung und Grammatik sollten immer überprüft werden, und Fremdwörter sollten kursiv geschrieben werden, sofern sie nicht Teil des normalen Sprachgebrauchs in der Zielsprache geworden sind.

5.5 Obszönität

Untertiteln erfordert einen sorgfältigen Umgang mit Obszönitäten und Tabusprachen. Díaz Cintas und Remael stellen fest, dass emotional aufgeladene Sprache besonders empfindlich ist, wenn sie von der mündlichen zur schriftlichen Form übergeht, da angenommen wird, dass ihre Wirkung stärker ist, wenn sie geschrieben anstatt ausgesprochen wird. Trotz dieser Auffassung müssen Untertitelende die gleiche Intensität vermitteln, die der Zielkultur angemessen ist, und die Essenz des Ausgangsinhalts wiedergeben, ohne zu zensieren oder abzuschwächen, es sei denn, der Ton selbst ist stummgeschaltet oder durch einen Piepton zensiert. Die Toleranzwerte für Obszönitäten sind je nach Kultur sehr unterschiedlich, daher sollten Untertitelende die Kultur berücksichtigen, in die sie sich einordnen, und ein Seherlebnis bieten, das mit dem Original vergleichbar ist. Je nach Kultur kann es angemessen sein, Obszönitäten oder Terminologie, die in einer bestimmten Region hetzerisch sein können, anzupassen.

Wenn das Audio zensiert oder durch einen Piepton zensiert ist, variiert die Behandlung der Untertitel je nach Sprache. Zu den Methoden gehört die Darstellung zensierter Ausdrücke mit Sternchen, Ellipsen oder Sonderzeichen. Finnisch und Spanisch verwenden beispielsweise den ersten Buchstaben gefolgt von Sternchen, Thailändisch ersetzt jeden Buchstaben durch Sternchen, Italienisch verwendet den ersten und letzten Buchstaben mit Sternchen dazwischen und Japanisch verwendet Sonderzeichen. Weitere Informationen findest du in den sprachspezifischen Styleguides von Prime Video.

5.6 Lieder und Musik

Für Lieder und Musik ist vor der Übersetzung eine Rechtefreigabe erforderlich. Inhaltsanbietende oder Lizenzgebende sind dafür verantwortlich, diese Freigabe vor der Lokalisierung einzuholen und sie an die relevanten Interessengruppen weiterzugeben. Für die Untertitelung sollten Songs nur aufgenommen werden, wenn sie als handlungsrelevant erachtet werden. Das heißt aber nicht nur thematisch relevant: Der Text muss Informationen vermitteln, die für das Verständnis der Handlung durch das Publikum unbedingt erforderlich ist. 

Bei Titelliedern am Anfang und Ende sollten diese nur dann mit Untertiteln versehen werden, wenn sie eindeutig handlungsrelevant sind, z. B. bei Inhalten für Kinder, bei denen der Text eine Geschichte erzählt. Im Allgemeinen sollten Titellieder am Anfang und Ende in Inhalten, die sich an ein erwachsenes Publikum richten, nicht mit Untertiteln versehen werden, mit Ausnahme von Untertiteln für Gehörlose und Schwerhörige (SDH). Wenn ein Song, der zur Handlung gehört, Text enthält, der für eine komödiantische Wirkung verändert oder parodiert wurde, sollte er lokalisiert werden, um diesen Effekt in der Zielsprache beizubehalten. 

Bei der Untertitelung von Liedtexten gelten bestimmte Formatierungskonventionen, um Einheitlichkeit und Lesbarkeit zu gewährleisten. Der Liedtext sollte kursiv geschrieben sein, um ihn vom regulären Dialog zu unterscheiden. Songtitel sollten in Anführungszeichen gesetzt werden, während Albumtitel kursiv geschrieben werden sollten. Die Groß- und Kleinschreibung von Liedtexten sollte den normalen Regeln folgen, wobei jede Textzeile mit einem Großbuchstaben beginnt. Am Ende von Textzeilen sollten nur Fragezeichen, Ausrufezeichen oder Ellipsen verwendet werden. Bei Bedarf können jedoch auch Kommas innerhalb von Zeilen verwendet werden.

Die Formatierungsanforderungen für Liedtexte variieren je nach Sprache erheblich. Beispielsweise enthalten viele romanische Sprachen Liedtexte mit Musiknotensymbolen am Anfang und Ende jedes Untertitels, die durch ein Leerzeichen vom Text getrennt sind. Japanisch verwendet keine Satzzeichen für Songs und schließt Songtitel mit geschweiften Doppelbyte-Anführungszeichen ein. Chinesische Sprachen schreiben den Text nicht kursiv und umschließen sowohl Songtitel als auch Albumtitel mit Guillemets. Arabisch umschließt Liedtexte, Songtitel und Albumtitel mit doppelten geraden Anführungszeichen. Schwedisch schreibt sowohl Liedtexte als auch Liedtitel kursiv. Jede Sprache hat spezifische Konventionen für Anführungszeichen, Groß- und Kleinschreibung und die Behandlung von Interpunktion. Wie immer sollten Untertitelende die sprachspezifischen Styleguides von Prime Video lesen, um sicherzustellen, dass die entsprechenden Anforderungen eingehalten werden.

5.7 Namensnennung der Übersetzenden

Die Namensnennung sollte hinzugefügt werden, wenn sie als letztes Ereignis des Untertitel-Assets verfügbar ist, mit einer Dauer von ca. 2–3 Sekunden und unter Verwendung des sprachspezifischen Formats für diese Art von Würdigung. Wenn mehre Übersetzende an demselben Asset gearbeitet hat, können beide genannt werden. Falls zutreffend, können auch Unternehmen und Creative Director genannt werden, allerdings sollte die Namensnennung von Unternehmen niemals die der Übersetzenden ersetzen. Für SDH sollten Namensnennungen nicht für Aufgaben enthalten sein, die nur die Transkription von Originalaudio oder synchronisiertes Audio beinhalten.

6. Fazit

Diese Richtlinien sind Ausdruck des Engagements von Prime Video für herausragende Untertitelung in allen Dimensionen des Lokalisierungs-Workflows. Durch die Schaffung eines einheitlichen Rahmens, der sowohl auf akademischer Forschung als auch auf Best Practices aus der Branche basiert, bieten sie Partnern die konzeptionelle Grundlage, um Untertitel zu erstellen, die kreativen Absichten gerecht werden und gleichzeitig ein breites globales Publikum ansprechen.

Die Integration universeller Prinzipien mit sprachspezifischen technischen Spezifikationen spiegelt auch den doppelten Charakter der Untertitelung wider: eine Disziplin, die sowohl kreatives Urteilsvermögen als auch technische Präzision erfordert. Diese Richtlinien sollten Untertitelenden helfen, ein natürliches und unaufdringliches Seherlebnis zu schaffen, während sie die dem Medium innewohnenden Beschränkungen überwinden – indem sie Verkürzung mit semantischer Vollständigkeit abwägen, kulturelle Referenzen anpassen und gleichzeitig die erzählerische Kohärenz wahren, technische Anforderungen respektieren und gleichzeitig die Lesbarkeit sicherstellen. 

Da sich die Lokalisierungslandschaft ständig weiterentwickelt, werden diese Richtlinien unser kontinuierliches Engagement für Qualität und Innovation leiten und sicherstellen, dass jede Produktion mit Untertiteln die kreative Vision des Originals berücksichtigt und gleichzeitig Inhalte über sprachliche und kulturelle Barrieren hinweg zugänglich macht.

7. Referenzen

Chaume, F. (2004). Cine y traducción. Madrid: Cátedra.
Díaz Cintas, J. and Remael, A. (2007). Audiovisual Translation: Subtitling. Manchester: St Jerome.
Georgakopoulou, P. (2009). “Subtitling for the DVD industry”, in Jorge Díaz Cintas and Gunilla Anderman (eds) Audiovisual Translation: Language Transfer on Screen. Basingstoke: Palgrave Macmillan, 21–35.
Pedersen, J. (2011). Subtitling Norms for Television: An Exploration Focussing on Extralinguistic Cultural References. Amsterdam and Philadelphia: John Benjamins.
Titford, C. (1982). “Subtitling-Constrained Translation”. Lebende Sprachen 27 (3): 113–116.

Untertitelungs-Richtlinien von Prime Video