Zacznijmy od tego czym jest w ogóle morfing.

Morfing (ang. morphing) – to technika przekształcania obrazu polegająca na płynnej zmianie jednego obrazu w inny, stosowana w filmie i animacji komputerowej.

Natomiast morfing głosu (ang. voice morphing lub voice conversion) to zaawansowana technika cyfrowej obróbki dźwięku, która polega na płynnym przekształcaniu głosu jednej osoby (źródłowej) w głos innej osoby (docelowej), przy jednoczesnym zachowaniu treści wypowiedzi.  Wykorzystuje algorytmy sztucznej inteligencji (AI), uczenie maszynowe oraz cyfrowe przetwarzanie sygnałów (DSP). System analizuje cechy głosu źródłowego (barwę, wysokość, tembr) i mapuje je na cechy głosu docelowego.

Badacze analizując podejście do ataków morfingu głosu na poziomie sygnału, ujawnili luki w zabezpieczeniach biometrycznych systemów rozpoznawania głosu. Wykazali, że atak morfingu głosu łączy tożsamości, aby ominąć biometrię głosową.

Mowa tu o morfingu tożsamości głosu w domenie czasu (TD-VIM), który umożliwia mieszanie tożsamości bez osadzania ich w strukturze lub tekście referencyjnym.

W systemach biometrycznych powszechną praktyką jest kojarzenie każdej próbki lub szablonu z konkretną osobą. Zaawansowany morfing tożsamości głosu (VIM) umożliwia generowanie próbki, która łączy tożsamości dwóch lub więcej osób mówiących. „Zmodyfikowaną próbkę głosu można wykorzystać do dopasowania wszystkich tożsamości, których próbki głosu wykorzystano do generowania ataków morfingowych, co stwarza wysokie ryzyko w scenariuszach zastosowań, takich jak bankowość i finanse, gdzie niezbędna jest pojedyncza weryfikacja tożsamości”.

Aby zbadać ten problem, zespół badawczy stworzył 4 odrębne sygnały morfingowe i ocenił ich skuteczność za pomocą kompleksowej analizy podatności. Dane porównano z metryką Generalized Morphing Attack Potential (G-MAP), „mierzącą skuteczność ataku w dwóch systemach weryfikacji mówców (SVS) opartych na uczeniu głębokim oraz jednym systemie komercyjnym, Verispeak”.
Wyniki podkreślają skuteczność metody TD-VIM w omijaniu zaawansowanych mechanizmów weryfikacji, podkreślając znaczenie poprawy bezpieczeństwa SVS.

Badania pochodzą z Indyjskiego Instytutu Technologii i Norweskiego Uniwersytetu Nauki i Technologii.

więcej o zjawisku morfingu głosu w artykule.


Ataki typu deepfake czyli oszustwa oparte na bazie AI dzięki wygenerowanej realistycznej próbce głosu z krótkiego nagrania (np. z mediów społecznościowych). Wykorzystanie fałszywej próbki głosu do nieautoryzowanych wejść na konta, tworzenia fałszywych reklam itp.

Wyciek danych biometrycznych. W przeciwieństwie do hasła, głosu nie można zmienić. Jeśli szablon głosowy wycieknie z bazy danych, jest on skradziony bezpowrotnie, co stwarza długotrwałe ryzyko dla tożsamości użytkownika.
Z raportu „Cyberzagrożenia, czego boją się Polacy” opracowanego m.in. przez Urząd Ochrony Danych Osobowych  wynika, że wycieku informacji (w ogóle) obawia się 1/3 Polaków. Najczęściej pojawiają się pytania, gdzie i w jaki sposób będą przechowywane dane, czy będą odpowiednio zabezpieczone i czy nie będą bezprawnie wykorzystywane.

Urata prywatności i wizerunku. Głos może zdradzać więcej niż tylko tożsamość – analiza mowy może ujawnić stan zdrowia, cechy psychiczne czy emocje, co może być także wykorzystane przeciwko użytkownikowi.

A dla Was co jest największym problemem?



Więcej o prywatności w  biometrii głosowej przeczytacie na naszym blogu
https://biometriq.pl/prywatnosc-w-biometrii-glosowej/