Czym jest zjawisko morfingu głosu?

Zacznijmy od tego czym jest w ogóle morfing.

Morfing (ang. morphing) – to technika przekształcania obrazu polegająca na płynnej zmianie jednego obrazu w inny, stosowana w filmie i animacji komputerowej.

Natomiast morfing głosu (ang. voice morphing lub voice conversion) to zaawansowana technika cyfrowej obróbki dźwięku, która polega na płynnym przekształcaniu głosu jednej osoby (źródłowej) w głos innej osoby (docelowej), przy jednoczesnym zachowaniu treści wypowiedzi.  Wykorzystuje algorytmy sztucznej inteligencji (AI), uczenie maszynowe oraz cyfrowe przetwarzanie sygnałów (DSP). System analizuje cechy głosu źródłowego (barwę, wysokość, tembr) i mapuje je na cechy głosu docelowego.

Badacze analizując podejście do ataków morfingu głosu na poziomie sygnału, ujawnili luki w zabezpieczeniach biometrycznych systemów rozpoznawania głosu. Wykazali, że atak morfingu głosu łączy tożsamości, aby ominąć biometrię głosową.

Mowa tu o morfingu tożsamości głosu w domenie czasu (TD-VIM), który umożliwia mieszanie tożsamości bez osadzania ich w strukturze lub tekście referencyjnym.

W systemach biometrycznych powszechną praktyką jest kojarzenie każdej próbki lub szablonu z konkretną osobą. Zaawansowany morfing tożsamości głosu (VIM) umożliwia generowanie próbki, która łączy tożsamości dwóch lub więcej osób mówiących. „Zmodyfikowaną próbkę głosu można wykorzystać do dopasowania wszystkich tożsamości, których próbki głosu wykorzystano do generowania ataków morfingowych, co stwarza wysokie ryzyko w scenariuszach zastosowań, takich jak bankowość i finanse, gdzie niezbędna jest pojedyncza weryfikacja tożsamości".

Aby zbadać ten problem, zespół badawczy stworzył 4 odrębne sygnały morfingowe i ocenił ich skuteczność za pomocą kompleksowej analizy podatności. Dane porównano z metryką Generalized Morphing Attack Potential (G-MAP), „mierzącą skuteczność ataku w dwóch systemach weryfikacji mówców (SVS) opartych na uczeniu głębokim oraz jednym systemie komercyjnym, Verispeak".
Wyniki podkreślają skuteczność metody TD-VIM w omijaniu zaawansowanych mechanizmów weryfikacji, podkreślając znaczenie poprawy bezpieczeństwa SVS.

Badania pochodzą z Indyjskiego Instytutu Technologii i Norweskiego Uniwersytetu Nauki i Technologii.

więcej o zjawisku morfingu głosu w artykule.