Textboxen vs. Sprachausgabe für Dialoge

Während eine Sprachausgabe den Zeitgeist der modernen Videospiellandschaft schmückt, waren es in der Vergangenheit Textboxen, die ein Stück weit die Fantasie von uns Virtuellosen anregten.
In diesem Beitrag werfe ich Gedanken in den Raum, welche Vorteile die jeweiligen Herangehensweisen denn mit sich bringen.

Wir schreiben das Jahr 2019. Noch immer sind Textboxen zur Veranschaulichung von Dialogen in Videospielen vertreten. Ich stellte mir die Frage nach dem Warum. Dabei zirkulierten verschiedene Gedanken in meinem Kopf: „Textboxen sind günstiger.“, „Sprachausgabe streckt die Entwicklungszeit.“, „Textboxen kurbeln die Vorstellungskraft an.“ „Überwiegend Nintendo setzt noch immer darauf, weil…“ Ja, warum eigentlich?

Während viele Publisher mittlerweile sehr cineastische Games produzieren, welche eine Sprachausgabe bieten, ist es der sympathische Konzern aus Kyōto, welcher selbst bei seinen stärksten und beliebtesten IPs noch immer auf Textboxen setzt, wenn es darum geht, wichtige Dialoge zu präsentieren.

Spiele wie „Fallout 3/New Vegas/4“, „The Witcher 3: Wild Hunt“, „Horizon: Zero Dawn“, die Uncharted-Reihe, die Metal Gear Soild-Reihe und viele mehr legen viel Wert auf gesprochene, also vollvertonte, Dialoge, um den jeweiligen Szenarien durch eine dichte Atmosphäre samt fein ausgearbeiteten Charakteren mehr Authentizität und Immersion zukommen zu lassen. Durch die generierten Identifikationsmerkmale wie Stimme, Sprechweise und -eigenheit sowie Betonung werden Charaktere greifbarer gestaltet.
Man stelle sich nun mal das Spiel „Metal Gear Solid: The Twin Snakes“ ausschließlich mit Textboxen vor. Würde euch das genauso beeindrucken, wie die hochwertige Sprachausgabe? Ich wage es zu bezweifeln.

Diese Szene ohne das Sprechen durch die Gasmaske wäre weniger eindrucksvoll.


Dem gegenüber stehen Softwaregrößen wie Donkey Kong, Pokémon, Super Mario, The Legend of Zelda, Kirby, Yoshi und viele mehr, die entweder weiterhin komplett auf Dialog-Textboxen setzen oder wie im Falle von „The Legend of Zelda: Breath of the Wild“ einen Kompromiss eingehen. Im letztegenannten werden Schlüsselszenen voll vertont, doch werden die meisten Gespräche dennoch in Textboxen verlagert. Wichtige Protagonisten sind vertont, doch leider auch nicht vollständig.
So war man im Jahr 2017 ganz baff, dass man im Nintendo Switch-Präsentationstrailer eine Erzählstimme hörte. Und nicht nur das: Charaktere sprachen sogar in den Zwischensequenzen.
Das sorgte vielerorts für Gänsehaut, Staunen und Jubel.
Eben weil man das Gefühl bekam, dass solch eine Art der Präsentation für ein Action-Adventure wie Zelda BotW einfach besser passt und mehr Emotionen weckt. Nicht wenigen Rezipienten sind beim Weinen von Zelda beim Schauen des Trailers ebenfalls die Tränen gekommen. Dies unter dem Einsatz von Textboxen zu schaffen, dürfte schwierig zu bewerkstelligen sein, denn schließlich hörte man vorher und auch danach stets Stimmen, die auf diesen Moment, gepaart mit der Musik, einstimmten.
Wenn dann am Ende des Trailers „Open your Eyes…“ zu hören ist, legt sich ein mystischer Abenteuerschleier über das Gesehene.

Wieso existieren Textboxen?

Textboxen für Dialoge wurden zu Anfang fast ausschließlich verwendet, da die Spielsysteme recht wenig Speicher zur Verfügung gestellt haben. Es war oft ein frickeliger Programmierakt, die Daten so weit zu komprimieren, dass sie auf die etwaigen Datenträger gepresst werden konnten; sei es eine Diskette, eine Cartrdige oder auch eine normale CD.

Man war schlichtweg gewohnt, Dialoge zu lesen und sich deren gesprochene Umsetzung vorzustellen. Zur damaligen Zeit war der Anspruch an gesprochene Dialoge eventuell auch vorhanden, eben aber kein weit verbreiteter Standard.
Dazu kommt, dass die Spiele von damals ohnehin nicht all zu groß waren und man keine Welten entwarf, die so weitläufig sind und so viele Charaktere bieten wie heutige Open World-Titel.
Der Wandel der Technik ermöglichte viele Elemente, die heute nicht mehr wegzudenken sind.

Früher hätte eine Sprachausgabe viel Speicherplatz gekostet.

Vor- und Nachteile

Nun bieten sowohl Textboxen als auch eine Sprachausgabe und sogar deren Kombination verschiedene Vor- und Nachteile für Spieler und Entwickler bzw. Publisher.

Textboxen zu kreieren, ist um ein Vielfaches kostengünstiger und weniger komplex als einen Dialog wirklich sprechen zu lassen.
Jemand schreibt einen Text, dieser muss dann noch lokalisiert werden.
In der Vergangenheit war es zwar eine echte Herausforderung, Textboxen zu lokalisieren, wenn man eine bestimmte Buchstabenzahl nicht überschreiten durfte, doch ist dies in der heutigen Moderne kein Problem mehr.
Eine Sprachausgabe wird hingegen in den meisten Fällen hoffentlich von Profis gesprochen – sogenannten Synchronsprechern. Diese Sprecher wollen bezahlt werden, was das Budget für eine Spieleentwicklung extrem ansteigen lässt, je nachdem wie viele Charaktere denn vertont werden sollen. Denn schließlich mag man ein und dieselbe Stimme nicht immer und immer wieder hören. Solch ein monotones Beispiel lässt die deutsche Fassung von „The Elder Scrolls V: Skyrim“ erblicken: Jede Wache in Himmelsrand spricht mit derselben Stimme. Das wirkt nicht nur unglaubhaft, sondern geradzu lächerlich.

Verständlichkeit: Hat man in einem Dialog mal etwas nicht verstanden, kann man ihn in bestimmten Situationen nicht zurückspulen. Der Text hingegen kann in Ruhe durchgelesen werden und wird in der Regel erst dann weitergeklickt, wenn alles verstanden wurde.

Während der Dialog in Textboxen einfach nur schlecht geschrieben sein kann, so können vollvertonte Gespräche darüber hinaus auch noch laienhaft klingen. Die Gefahr, etwas schlecht zu präsentieren, steigt also. Wobei man nun auch argumentieren könnte, dass eine reine Textbox-Präsentation auch nicht besser ist…

Wie schon erwähnt, wecken gesprochene Dialoge einfach mehr Emotionen und lassen eine Szene glaubhafter wirken.
Denken wir beispielsweise an „The Legend of Zelda: Sykward Sword“, so fällt auf, dass viele Szenen durch einen Dialog aufgesplittet werden und erst weiterlaufen, wenn wir den A-Button drücken, wodurch der Dialog und die Szene dann erst weiterlaufen. Solch eine Methode zerstückelt die Präsentation und lässt es unnötig stockend wirken. Dies ist einfach nicht zeitgemäßg.

Diese Szene läuft erst dann weiter, wenn ihr bestätigt.

In Dialogen allerdings, die keine dynamische Szene unterstreichen, können Textboxen auch beruhigend wirken. Meistens werden Geräusche/Laute und starke Mimik sowie Gestik offenbart, sodass man sich Stimmen und Gemütszustand im weiteren Verlauf des Gesprächs vorstellen kann.
Dadurch hat man die Freiheit, sich selbst ein Stück weit sein Gegenüber vorzustellen, wohingegen bei einem vertonten Dialog schon alle Nuancen zum Vorschein kommen.
Das genannte Beispiel von Zelda BotW bietet dem Spieler beides, auch wenn das Motiv dahinter unklar bleibt. Wollte man hier bewusst einen Kompromiss zwischen Tradition und Moderne schaffen oder einfach Entwicklungskosten und Arbeit sparen? Keine Ahnung.

Nun werden aber auch Games im Retro-Look entworfen. Passt dort eine Vertonung denn überhaupt oder sollte man bei den Textboxen bleiben?
Ein schönes Beispiel für diese Frage bietet „Octopath Traveler“ von Square Enix, welches zunächst exklusiv für die Nintendo Switch erschienen ist.
Hier hören wir einerseits gesprochene Dialoge und Monologe, anderseits finden wir aber auch klassische Textboxen.

Ich persönlich finde die Kombination recht angenehm, wohingegen die Fachpresse vielerorts einen Kritikpunkt darin sah, dass vieles eben nicht vertont ist. Ich denke, da gibt weder absolut richtige Ansichten, noch das Gegenteil. Es ist eine Geschmackssache. Gerade, da hier die Mimik und Gestik nur sehr minimalistisch dargestellt werden, wirkt eine Vertonung nicht so, als käme sie wirklich aus dem Mund des Protagonisten, sondern von jemandem, der das Geschehen aus der Ferne betrachtet.

Die Pokémon-Reihe erfreut sich nach wie vor großer Beliebtheit und wird mit den Schild/Schwert-Editionen im November diesen Jahres nach den Let’s Go-Ablegern erneut Einzug auf die Nintendo Switch finden.
Eine Sprachausgabe werden diese Spiele nicht bieten, was bei einem RPG der erfolgreichsten Entertainment-IP der Welt etwas verwunderlich erscheint. Gerade hier würden sich vertonte Dialoge doch geradezu anbieten, zumindest was die wichtigen unter ihnen betrifft.
Hier vermute ich, dass Game Freak den Arbeitsaufwand möglichst gering halten mag, was in sämtlichen Aspekten der Reihe zum Vorschein kommt.

In Spielen hingegen, in denen bestimmte Charaktere vorkommen, würde eine Sprachausgabe bei den gewohnt charismatischen Lauten wohl eher fehl am Platze wirken. Ich kann mir nur schlecht vorstellen, wie Yoshi, Bowser oder Donkey Kong sprechen. Hm, eventuell aber die Charaktere drumherum?
Warum geht man diesen Schritt nicht? Weil es zu ungewohnt wäre? Eventuell sogar schlecht bei der Spielerschaft ankommen könnte?
Oder um sich einen gewissen Charme beizubehalten, den die Laute samt Textboxen in solchen Beispielen nunmal haben? Keine Ahnung.

Bowser brabbelt in seiner eigenen Sprache.

Charme?

Versprüht die Kombination aus bekannten Lauten, auffälligen Bewegungen und Textboxen einen gewissen Charme? Ich finde ja!
Nur kommt es dabei auf die Art Spiel und Dialog an.
Selbst im genannten Beispiel von „The Legend of Zelda: Skyward Sword“ finde ich es irgendwo charmant, dass der klassische Weg beschritten wird, gleichzeitig aber auch störend und schlecht gealtert. Ein Zwiespalt.
Ob dieser eventuell nur daher rührt, dass ich es die meiste Zeit so konsumiert habe? Schon möglich; und eventuell würde mich eine komplette Veränderung nach einer gewissen Eingewöhnungszeit auch gar nicht stören.

Dann existiert da noch eine Mischform: Animal Crossing. Dies ist ein Charlie Brown-Beispiel. Auch Bowser in „Super Mario Odyssey“ spricht in einer Zwischensequenz, nur eben in einer Fantasiesprache.
Dem Spieler werden aneinandergereihte Laute in einem Redefluss präsentiert. Ebenso geschah dies schon in den Banjo-Spielen auf dem N64.
Der Vorteil ist, dass man das Gefühl für ein Gespräch bekommt, man als Entwickler die Vertonung aber nicht synchronisieren muss. Man verpasst den Charakteren damit etwas extrem Einprägsames, läuft aber auch Gefahr, den Spieler mit solchen Lauten zu nerven.
Gleichzeitig ist es so aber recht einfach, alle vorkommenden Charaktere mit einer Sprachausgabe auszustatten.
Würde man darüber hinaus dann noch die Funktion einbetten, diese Sprachausgabe auszuschalten, könnte man, sollte die Lautsprache Gefallen finden, potenziell beide Lager beglücken.
Eine solche Herangehensweise spart zudem auch Speicherplatz, da nur wenige Satzfragmente erstellt werden, die dann überwiegend zufällig zusammengewürfelt werden.

Ein paar wenige Laute zufällig aneinandergereiht.

Fazit

Sowohl die Sprachausgabe als auch die Textboxen sowie die Kombination dieser beiden Elemente, die sehr häufig vertreten ist, haben ihre Stärken und Schwächen. Es hängt oftmals vermutlich von der Art des Games und dessen Präsentation ab, was nun geeigneter für den Entwickler erscheint und individuell für den Spieler wahrgenommen wird.
Es ist wohl meistens Geschmackssache, was nun stärker berührt und die Fantasie anregt.
Klar ist auch, dass solche Entscheidungen oftmals einen stark wirtschaftlichen Faktor innehalten, da eine Sprachausgabe die Komplexität der Entwicklungsleitung und das Entwicklungsbudget in die Höhe schnellen lässt.

Über Justin Aengenheyster 328 Artikel
Im Jahr 1992 erschien Mortal Kombat... und ich. Wir beide sind auf unsere Weise brutal. Ich für meinen Teil fahre brutal auf Videospiele ab und beschäftige mich gnadenlos mit verschiedenen Themen, um Gleichgesinnte zu informieren. Als treues Nintendokind befasse ich mich am liebsten auch mit Nintendospielen.

Ersten Kommentar schreiben

Antworten

Deine E-Mail-Adresse wird nicht veröffentlicht.


*