Für einen Showcase hat RTL Deutschland in Zusammenarbeit mit Microsoft die Stimmen von RTL-Moderator Maik Meuser und Podcast-Host Inken Wriedt durch eine künstliche Intelligenz synthetisiert. Aus wenigen Stunden Audiomaterial sind lebensechte, natürlich klingende Versionen ihrer Stimmen entstanden, die vom menschlichen Original nicht mehr zu unterscheiden sind. Diese Stimmen wurden in einem Experiment über mehrere Wochen als Vorlesefunktion auf ntv.de genutzt.
Wie nehmen User*innen die synthetisierte Stimme ihrer Lieblingssprecherin in einem solchen Kontext wahr? Was bedeutet es für den Journalismus und die Glaubwürdigkeit eines Nachrichtensprechers, wenn er nicht mehr selbst in der Hand hat, was mit seiner Stimme gesagt wird? Und wie kann eine solche Technologie verantwortungsvoll eingesetzt werden? In diesem Lightning Talk geben wir euch einen Einblick in unseren Use Case, teilen unsere Erkenntnisse mit dieser Technologie und fordern euch heraus: Könnt ihr die künstliche Stimme vom Original unterscheiden?