Wystawa upłynęła pod znakiem wszechobecnej AI. Wiele firm zaprezentowało swoje najnowsze osiągnięcia w konstruowaniu systemów komunikujących się autonomicznie z ludźmi. Ogromne zainteresowanie wzbudził humanoidalny robot Ameca (Etisalat) wchodzący w interakcję ze swoimi rozmówcami. Stoiska z interaktywnymi agentami (Amdocs) oferowały wręcz nieprawdopodobną jakość obrazu oraz mowy generowanej przez systemy.

Google zaprezentowało Gemini Live, stanowiący odpowiedź na tryb głosowy ChatGPT. Gemini Live posiada funkcję Share Screen With Live, która pozwala podejmować Gemini intrakcję z obrazem wyświetlanym na ekranie telefonu. Deutsche Telekom wskazał możliwy kierunek rozwoju telefonów zamieniając cały telefon w chatbota. Telefon nie ma żadnych aplikacji i jest personalnym asystentem komunikującym się głosowo z użytkownikiem. Podstawą rozwiązania jest cyfrowy asystent z AI Perplexity ale ma być on otwarty również na m.in. Google Cloud AI, ElevenLabs, oraz Picsart. Południowokoreański startup Newnal zaprezentował nowy system operacyjny dla telefonów komórkowych, który wykorzystuje historyczne oraz bieżące dane użytkownika do stworzenia spersonalizowanego asystenta AI który ma docelowo stać się awatarem AI zachowującym się tak jak użytkownik.

Wszystkie wymienione jak również wiele innych rozwiązań łączy wykorzystanie technologii głosowych do dwustronnej komunikacji. Kierunek wskazany na MWC 2025 jest jasny – nasze działania będą wspierane przez awatary i boty komunikujące się z nami autonomicznie. Możliwość szybkiego, maszynowego potwierdzenia tego z kim rozmawiamy staje się wobec tego jeszcze ważniejsza niż kiedykolwiek wcześniej gdyż jakość autonomicznych systemów komunikacji głosowej nie daje gwarancji prawidłowej weryfikacji mówcy przez człowieka.

Fot. Andrzej Tymecki

 


Zastanawialiście/ łyście się kiedykolwiek czy głos jest częścią wizerunku?
Jeśli przyjmiemy, że na wizerunek składają się cechy fizyczne, po których można rozpoznać osobę ( jak podaje Wikipedia czy słownik PWN ) to głos jest niewątpliwie istotnym elementem takiej identyfikacji.

Według nas głos jest nie tylko elementem wizerunku ale unikalną cechą biometryczną potwierdzającą tożsamość.


Co przemawia za tym faktem?
Każda osoba ma unikalny głos, składający się z wielu odrębnych elementów. Mimo, że może być on podobny do głosu innej osoby, to w swojej charakterystyce będzie miał cechy mówiące o jego unikalności. Pozwala on na skuteczną identyfikację mówcy nie tylko dzięki rozpoznawalności barwy ale również ocenie biometrycznej. Stosując zaawansowane algorytmy biometrii, jesteśmy w stanie z bardzo wysokim, ponad 90 procentowym prawdopodobieństwem określić czy głos należy do danej osoby i czy nie jest fałszywy (wygenerowany przez AI).