Sprache – Fake oder Real?

Die Stimme eines Menschen ist ein einzigartiges Personenmerkmal, vergleichbar mit dem Fingerabdruck. Dieses biometrische Verfahren wird zur Stimmerkennung, Sprach-Authentifizierung und zur Stimmsignatur benutzt. Stimmmerkmale liegen in ihrer Einzigartigkeit bei 1:10000 Fehlbewertungen.

Die Stimmenerkennung ist Fluch und Segen zugleich. Insbesondere durch die zunehmende Digitalisierung wird sie im Alltag immer präsenter.

Sprachbefehle, wie zum Beispiel Sprachsteuerung des Smartphones, von Musikboxen, wie Apple´s Homepod oder Amazon´s Alexa, oder technischen Funktionen des Autos, sind eine Normalität geworden. Warum auch nicht? Die vielseitigen Möglichkeiten bieten Komfort und erleichtern den Alltag. Mit der Stimmenerkennung gehen jedoch auch viele Gefahren einher, welche sich der Normalverbraucher nicht unbedingt bewusst ist.

Mit Hilfe von KI können Stimmen geklont werden. Z.B. wirken Schockanrufe dadurch noch deutlich realistischer und überzeugender.

Abbildung: AdobeStock 726339613

DigiFors arbeitet gemeinsam mit dem Fraunhofer-Institut IDMT im Projekt SpeechTrust+ zusammen an einer Lösung.

In der Zusammenarbeit mit dem Fraunhofer-Institut, wird ein besonderes Augenmerk auf die „KI-basierte Sprachsynthese“ geworfen. Diese ist in der Lage Deepfakes zu erstellen.v SpeechTrust+ und die technischen Entwicklungen dahinter, sind in der Lage KI-basierte Sprachsynthese und Sprachverfremdungen zuverlässig zu erkennen. SpeechTrust+ arbeitet mit den gleichen KI-Methoden, wie bei der Sprachsynthese, kombiniert diese mit Methoden aus der Audioforensik, um künstlichen Sprachnachrichten auf die Spur zu kommen.

Besonders im Punkt Datensicherheit stellen die Fälschungen ein großes Problem dar.
Die Deepfakes der Sprach- und Stimmenerkennung werden insbesondere gefährlich, wenn es um öffentliche wichtige Informationen, wie zum Beispiel Sicherheitsinformationen in Krisenfällen, geht. Auch gefälschte Aussagen von Politikern vermögen zu Problemen zu werden. Entstehende Unruhe und Ängste der Menschen sowie nationale und internationale Probleme sind nicht auszuschließen.
Auf Grund dessen, das Deepfakes für Jeden relativ leicht zu erstellen sind, unterläuft Jeder der Gefahr, Opfer von Stimmenverfremdung zu werden. Da die eigene Stimme einzigartig ist, kann der „Fehler“, in der vermeintlich echten Stimmaufnahme, entlarvt werden. In Zusammenarbeit mit dem Fraunhofer-Institut IDMT bietet DigiFors, mittels spezieller Techniken, auch besonders große Datenmengen auf Echtheit zu prüfen. Vor allem forensische Gutachten, bieten hierzu eine hervorragende Möglichkeit.

Die SpeechTrust+ Detektoren und die KI des Fraunhofer-Instituts in Kombination mit den forensischen Gutachten der DigiFors, bieten zusammen somit optimalen Schutz vor Sprachsynthese- und Verfremdung. Besonders Unternehmen, Kanzleien und die Strafverfolgungsbehörden können davon profitieren.

Spracherkennung und Stimmenforensik bzw. Audioforensik sollte, vor allem im Zeitalter der zunehmenden Digitalisierung ein dauerhaft präsentes Thema sein. Egal wie ansprechend und sicher Technologien scheinbar sind, sollten die Nachteile nie außer Acht gelassen werden. Dadurch kann ein sicherer und noch besserer Umgang mit diesen Technologien gewährleistet werden.