Die Sonntagsfrage

Warum ist Text to Speech keine Lösung fürs Hörbuch, Herr Vester?

26. Juni 2022
von Börsenblatt

Computerstimmen statt Hörbuchsprecher:innen? Bei der Jahrestagung der Hörbuchverlage war Text To Speech (TTS) Top-Thema, jetzt teilte der Digitalexperte Bookwire, sein Angebot um TTS-Technologie zu erweitern. „Die Nachricht war ein ziemlicher Schlag“, meint Hörbuchverleger Claus Vester (cc-live). Was er gegen die neue Möglichkeit der Vertonung von Text durch künstliche Stimmen hat, erklärt er in der Sonntagsfrage.

Claus Vester

Die Nachricht war ein ziemlicher Schlag. Ich dachte nicht, dass es so schnell geht und pures Wirtschaftlichkeitsdenken den Menschen beiseite drückt… Es hat etwas gedauert, bis ich die Meldung halbwegs verdaut habe. Das Text to Speech auch und vor allem bei Sachbüchern den menschlichen Sprecher ersetzen kann, dem kann ich nur vehement widersprechen!

Eines der besten Beispiele ist der Vortrag Theodor W. Adornos "Aspekte des neuen Rechtsradikalismus", der zwar im O-Ton ziemlich "fad" ist, aber durch den Sprecher Axel Wostry für viele erst wirklich verständlich wurde: „Die Lesung reißt auch jene mit, die sonst vor der Komplexität von Adornos Sprache eher zurückschrecken“, heißt es in der Begründung der Jury, die das Hörbuch in die hr2 Hörbuchbestenliste 11/2019 aufgenommen hat. Im Übrigen gilt auch für den Vortrag von Fachbüchern, woran wir uns alle aus Schulzeiten erinnern: Es gibt Lehrer, die konnten den Stoff durch ihren Vortrag besser vermitteln als andere. Viel besser.

Der Computer mag die Aussprache von Fremdwörtern sicher perfekt meistern, aber mitreißen geht anders. Ich empfinde, sorry, Text to Speech als Ohrfeige für alle Sprecher, die versuchen, einen Text für die Hörerinnen und Hörer im besten Wortsinn zu erschließen.

Der Computer mag die Aussprache von Fremdwörtern sicher perfekt meistern, aber mitreißen geht anders. Ich empfinde, sorry, Text to Speech als Ohrfeige für alle Sprecher, die versuchen, einen Text für die Hörerinnen und Hörer im besten Wortsinn zu erschließen. Und die dabei möglichst auch von einer Regie unterstützt werden. Wohin rein wirtschaftliches Denken führen kann? Aus Kostengründen spart sich manch Hörbuch-Publisher bereits die Regie, dann häufig auch das Tonstudio mitsamt versiertem Techniker – „Selbstfahrer“ heißt das Zauberwort. Kein Wunder, dass man jetzt auch den menschlichen Sprecher, die menschliche Sprecherin, einzusparen möchte. Da trifft es sich auch gut, dass für einen von einer K.I. produzierten Content keine Urheberrechte geltend gemacht werden können.  

Das Fell des Bären schrumpft immer weiter

Ich bin der Meinung: Sprecher:innen sind als Miturheber beim Hörbuch zwingend am wirtschaftlichen Erfolg desselben zu beteiligen. Die für die Aufnahme bezahlte Gage kann und sollte dabei – analog zu den Autor:innen – als verrechenbarer Vorschuss gesehen werden. So einfach könnte und sollte es sein. Wenn jetzt auch noch faire Preise für das Endprodukt bezahlt würden, könnten alle Beteiligten gut damit zurechtkommen.

Leider schrumpft das Fell des Bären mangels einer Preisbindung beim Hörbuch und der viel zitierte Hörbuch-Boom kommt pekuniär nicht bei den Content-Produzenten an.

Die Realität bei Stückerlös sieht ja leider so aus:

Grundlage ist ein auf das jeweilige Medium zugeschnittener UVP, der beim haptischen Produkt (CD) 100 Prozent des Handelsabgabepreises, beim Download 66 Prozent, beim Download-Abo 20 Prozent, beim Streaming 2 Prozent vom eHAP zur Ausschüttung bringt. Da klingt es schon fast zynisch, wenn man das Streaming eines Hörbuchs als Werbung für Buch und Autor verkauft. Und da ist der Schritt zu Text to Speech für manchen rein wirtschaftlich fokussierten Verlag natürlich logisch.