Jak podaje biometric update wizerunek twarzy na koszulce może być przedmiotem fałszerskiego ataku. Koszulki stały się zagrożeniem dla rozpoznawania twarzy, ale nowe badanie pokazuje, jak temu zapobiec!

Dyskusje na temat ataków biometrycznych zazwyczaj koncentrują się na próbach oszustw finansowych, ale coraz częstsze wykorzystywanie rozpoznawania twarzy w miejscach publicznych skłoniło naukowców do opracowania sposobów oszukiwania tej technologii w celu obejścia zabezpieczeń lub nadzoru. Jedną z metod, która okazała się skuteczna w kontrolowanych eksperymentach są obrazy przedstawiające atakujących na koszulkach. Najnowsze odkrycie w tej dziedzinie polega na zastąpieniu obrazów atakami polegającymi na prezentacji twarzy: koszulka z nadrukowaną ludzką twarzą jest prezentowana kamerze, co oszukuje system rozpoznawania twarzy, sprawiając, że uwierzy, iż widzi prawdziwą, trójwymiarową twarz.

Nowy artykuł grupy naukowców z Uniwersytetu Nauk Stosowanych w Niemczech przedstawia sposób zapobiegania tym właśnie atakom polegającym na prezentacji twarzy.

Naukowcy przetestowali 3 powszechnie stosowane algorytmy detekcji twarzy typu open source: RetinaFace, MTCNN i dlib, w oparciu o bazę danych T-shirt Face Presentation Attack (TFPA). Baza danych zawiera ponad 1600 zdjęć pochodzących ze 100 różnych koszulek, na każdej z nich nadrukowano wizerunek twarzy.

8 osób nosiło koszulki z nadrukowanymi twarzami w różnych pozach, a ich zdjęcia zostały zarejestrowane za pomocą kamery RealSense D435, zdolnej do rejestrowania informacji o głębi obrazów 3D.

W prawie wszystkich przypadkach algorytmy detekcji twarzy wykryły twarz na koszulce. Średni szacowany wskaźnik detekcji 3 algorytmów przekroczył 99% dla wszystkich ośmiu pozach, jak pokazują wyniki. Badanie wykazało również, że jeśli atakujący ukryłby twarz, zasłaniając ją dłońmi, nosząc maskę na twarz lub przechylając głowę, system biometryczny twarzy prawdopodobnie zwróciłby dopasowanie do koszulki – co oznaczałoby, że atak zakończyłby się sukcesem.

Sukces tego ataku prezentacyjnego jest niepokojący, ponieważ koszulki są łatwe do wykonania. Można je również ukryć pod kurtką, co oznacza, że ​​są łatwiejsze w użyciu pod nadzorem niż coś rzucającego się w oczy, takiego jak n. papierowa maska. Ataki z wykorzystaniem koszulek zostały już zidentyfikowane przez służby graniczne jako potencjalne zagrożenie.
Aby rozwiązać ten problem, naukowcy rozszerzyli bazę danych o 152 autentyczne prezentacje i zaproponowali nową metodę wykrywania. Zgodnie z wynikami badań, proponowany algorytm można łatwo połączyć z tradycyjnymi algorytmami wykrywania ataków prezentacyjnych.

Tekst na podstawie https://www.biometricupdate.com/202605/t-shirts-have-become-a-facial-recognition-threat-a-new-study-shows-how-to-stop-it

Zacznijmy od tego czym jest w ogóle morfing.

Morfing (ang. morphing) – to technika przekształcania obrazu polegająca na płynnej zmianie jednego obrazu w inny, stosowana w filmie i animacji komputerowej.

Natomiast morfing głosu (ang. voice morphing lub voice conversion) to zaawansowana technika cyfrowej obróbki dźwięku, która polega na płynnym przekształcaniu głosu jednej osoby (źródłowej) w głos innej osoby (docelowej), przy jednoczesnym zachowaniu treści wypowiedzi.  Wykorzystuje algorytmy sztucznej inteligencji (AI), uczenie maszynowe oraz cyfrowe przetwarzanie sygnałów (DSP). System analizuje cechy głosu źródłowego (barwę, wysokość, tembr) i mapuje je na cechy głosu docelowego.

Badacze analizując podejście do ataków morfingu głosu na poziomie sygnału, ujawnili luki w zabezpieczeniach biometrycznych systemów rozpoznawania głosu. Wykazali, że atak morfingu głosu łączy tożsamości, aby ominąć biometrię głosową.

Mowa tu o morfingu tożsamości głosu w domenie czasu (TD-VIM), który umożliwia mieszanie tożsamości bez osadzania ich w strukturze lub tekście referencyjnym.

W systemach biometrycznych powszechną praktyką jest kojarzenie każdej próbki lub szablonu z konkretną osobą. Zaawansowany morfing tożsamości głosu (VIM) umożliwia generowanie próbki, która łączy tożsamości dwóch lub więcej osób mówiących. „Zmodyfikowaną próbkę głosu można wykorzystać do dopasowania wszystkich tożsamości, których próbki głosu wykorzystano do generowania ataków morfingowych, co stwarza wysokie ryzyko w scenariuszach zastosowań, takich jak bankowość i finanse, gdzie niezbędna jest pojedyncza weryfikacja tożsamości”.

Aby zbadać ten problem, zespół badawczy stworzył 4 odrębne sygnały morfingowe i ocenił ich skuteczność za pomocą kompleksowej analizy podatności. Dane porównano z metryką Generalized Morphing Attack Potential (G-MAP), „mierzącą skuteczność ataku w dwóch systemach weryfikacji mówców (SVS) opartych na uczeniu głębokim oraz jednym systemie komercyjnym, Verispeak”.
Wyniki podkreślają skuteczność metody TD-VIM w omijaniu zaawansowanych mechanizmów weryfikacji, podkreślając znaczenie poprawy bezpieczeństwa SVS.

Badania pochodzą z Indyjskiego Instytutu Technologii i Norweskiego Uniwersytetu Nauki i Technologii.

więcej o zjawisku morfingu głosu w artykule.

Okazuje się, że deepfake audio może być groźniejszy niż wideo! Wg raportu Pindrop w ciągu dwóch lat 2023-2024 nastąpił wzrost liczby tego rodzaju deepfake’ów (audio) aż o 760 %.


W dobie nasilających się ataków samoświadomość wydaje się być tutaj kluczową barierą ochronną człowieka przed tego typu zagrożeniami. Chodzi o:

●  ograniczone zaufanie do asystentów głosowych,
● znajomość socjotechnik stosowanych przez oszustów,
● kontrolę nad treściami publikowanymi przez siebie w necie.

W rozwiązaniach systemowych oczywistym jest stosowanie zaawansowanych technologii biometrycznych i metodologii do wykrywania deepfake’ków w czasie rzeczywistym.

Na przykład Pindrop jako jedną z możliwości wykorzystuje technikę zwaną akustycznym odciskiem palca. Polega ona na utworzeniu cyfrowego podpisu dla każdego głosu w oparciu o jego właściwości akustyczne, takie jak wysokość, ton i kadencja. Podpisy te są następnie wykorzystywane do porównywania i dopasowywania głosów w różnych połączeniach i interakcjach. Większą dawkę wiedzy o deepfake’ach znajdziecie w podkaście z udziałem Vijay Balasubramaniyan,CEO Pindrop. Link poniżej
https://www.biometricupdate.com/202504/biometric-update-podcast-digs-into-deepfakes-with-pindrop-ceo

Dla przypomnienia Pindrop to firma z siedzibą w Atlancie, USA. Rozwiązania tej firmy wyznaczają drogę ku przyszłości komunikacji głosowej, ustanawiając standardy tożsamości, bezpieczeństwa i zaufania w przypadku każdej interakcji głosowej. Więcej na pindrop.com

Jak skutecznie wykrywać oszustwa na bazie głosu? Jak odróżnić głos prawdziwy od fejkowego, czyli np. tego wygenerowanego na bazie AI? Odpowiedź jest prosta. Do tego są potrzebne zaawansowane narzędzia z zakresu biometrii głosowej i szereg analiz. Publikujemy tu dwa przykłady, które jakiś czas temu poddaliśmy analizie w naszym laboratorium i dzięki autorskiemu algorytmowi oceniliśmy z bardzo dużym prawdopodobieństwem czy głos jest prawdziwy lub fałszywy oraz w jakim stopniu jest on spójny z głosem danej osoby.

Analizy dotyczą:

● rozpoznania głosu jednego z rosyjskich pranksterów Prezydenta Dudy udającego Prezydenta Macrona

● oceny zbieżności głosów aktorów Piotra Fronczewskiego i Filipa Pławiaka w filmie Rojst. Panowie grają w produkcji odpowiednio tę samą osobę (Kociołek) w wieku dorosłym oraz w młodości.

Dzielimy się z Wami wnioskami z tych eksperymentów.

Porównanie biometryczne głosów Fronczewskiego i Pławiaka.

Do tego celu użyliśmy 25 sekund łącznych wypowiedzi obu postaci, złożonych z kilku fragmentów ich oryginalnej mowy, na bazie oryginalnej ścieżki filmowej. Jaką uzyskaliśmy zgodność?
Wyniki analizy  pokazały, że głosy biometrycznie aktorów NIE są spójne. Pławiak wypowiedź vs Fronczewski VP  – tylko 15% zgodności, Fronczewski wypowiedź vs Pławiak VP – 11%, ale co ciekawe nie dostrzega się tych różnic na poziomie ucha. W naszym odbiorze głosy Pławiaka i Fronczewskiego są wręcz identyczne. I o to w konsekwencji tutaj chodzi.

Dla obu postaci płeć oraz narodowość zostały rozpoznane z minimalną niepewnością (wynik prawie 100%). Została również wykryta różnica wieku między postaciami, oszacowana  na 20 lat.

Analiza głosów rosyjskich pranksterów Władimira Kuzniecowa (Vovan) i Aleksieja Stoljarowa (Lexus) podszywających się pod Prezydenta Macrona.


W tym przypadku poddaliśmy analizie biometrycznej nagrania z głosami pranksterów i porównaliśmy je z głosem prawdziwego Macrona (w wersji zarówno polskiej jak i angielskiej). Wszystkie próbki głosu w postaci pojedynczych nagrań pobraliśmy z domeny publicznej You Tube. Naszym celem było potwierdzenie skuteczności systemów biometrycznych dla tej konkretnej sytuacji – identyfikację oszustwa.

Okazało się, że głos jednego z pranksterów „Lexusa” jest w niewiele ponad 50% spójny z głosem Prezydenta Francji natomiast aż w 97 % zgodny z głosem fałszywego prezydenta. Głos drugiego – „Vovana” nie wykazał żadnych podobieństw (0%) do fake’owego prezydenta.

 To jednoznacznie dowodzi, że dzięki biometrycznej analizie udało się nam:

● wykryć fakt,  i to zaledwie po upływie 1 minuty,  że w rozmowie brał udział fałszywy prezydent
● zidentyfikować  tożsamość fikcyjnego prezydenta (Lexus)
● potwierdzić, że domena publiczna jest bardzo dobrym źródłem próbek głosu, który może być wykorzystany nie zawsze w szczytnych celach  
● wzmocnić tezę, że najskuteczniejsze ataki to te z wykorzystaniem socjotechnik, a w tym przypadku był nią wybór odpowiedniego czasu, w którym Prezydent miał do czynienia z wzmożonym stresem (upadek rakiety). 

To tylko wybrane przykłady zastosowania specjalistycznych narzędzi biometrycznych do potwierdzania tożsamości osób. Implementowane w przyszłości mogą pomagać w wykrywaniu nadużyć na bazie głosu.