Technologia naśladowania ludzkiej mowy przez maszyny coraz bardziej doskonała. Wkrótce dzwoniąc na call center, nie rozpoznamy, czy rozmawiamy z człowiekiem

0
Technologia naśladowania ludzkiej mowy przez maszyny coraz bardziej doskonała. Wkrótce dzwoniąc na call center, nie rozpoznamy, czy rozmawiamy z człowiekiem

Automatyzacja obsługi z wykorzystaniem sztucznej inteligencji i generatorów mowy może zrewolucjonizować systemy telefonicznej obsługi klienta. Choć roboty idealnie naśladują już ludzki głos i skutecznie analizują ludzką mowę, to coraz częściej podnoszone są kwestie etyczne. Voice-boty nie powinny naśladować ludzi, by nie wprowadzać w błąd klientów – twierdzą eksperci branży.

– Ludzie, gdy dzwoni telefon, spodziewają się, że dzwoni człowiek, więc jeżeli jest to coś zbliżonego do człowieka, to zakładają, że jest człowiek. Tymczasem voice-boty stają się coraz bardziej naturalne. Mają coraz bardziej ludzki głos i rozmawiają już jak człowiek. Możemy teraz zauważyć trend, że automaty nie są zbyt regularne, że one np. czasami się pomylą, coś powtórzą albo zrobią jakąś przerwę – wszystko po to, by skuteczniej przypominać człowieka – mówi agencji informacyjnej Newseria Innowacje Bartosz Ziółko z Techmo.

Technologia voice-botów jest coraz bardziej zaawansowana. Maszyny już w bardzo dużym stopniu potrafią naśladować ludzi, włącznie z poprawnym akcentowaniem sylab. Z dostarczanego przez Silicon Intelligence voice-bota Guiyu korzystają głównie firmy zajmujące się handlem. Służy on do kontaktów z klientami, z którymi może się porozumiewać w języku mandaryńskim, angielskim i japońskim. Guiyu rozpoznaje, co mówi klient, i zapisuje to jako tekst. Następnie bot analizuje tekst w oparciu o obszerną bazę fraz i zdań, by stworzyć odpowiedź. Wreszcie Guiyu przekształca swoją pisemną odpowiedź w głosową wypowiedź.

– W tej chwili jest bardzo duże zainteresowanie w uruchamianiu tzw. voice-botów, czyli automatycznej obsługi klienta przez telefon, dzięki którym klienci mogą rozwiązać swoje podstawowe problemy. One są zazwyczaj powtarzalne, dlatego można skupić pracę ludzi na zadaniach trudniejszych, nieszablonowych, a większość spraw zleconych do call center można rozwiązywać automatycznie. Jest również zastosowanie w reklamach przez telefon albo miękkiej windykacji – przekonuje Bartosz Ziółko.

Choć współczesna technologia pozwala na generowanie głosu do złudzenia przypominającego ludzką mowę, to coraz częściej podnoszona jest etyczna strona tej technologii.

Czytaj również:  Nadpłaty w składce wypadkowej. W każdej branży inne wyzwanie

– My rekomendujemy klientom, żeby niekoniecznie stosować taki bardzo naturalny głos, bo to wywołuje u odbiorców efekt zbliżony do uncanny valley, czyli że ludzie tracą poczucie, co się dzieje. To jest rzecz do przemyślenia, czy te automaty nie powinny tonem głosu oświadczać: rozmawiasz z automatem, mów jak do automatu – twierdzi ekspert.

Technologia związana z generowaniem i rozpoznawaniem mowy wykorzystywana jest jednak również w drugą stronę – nie do prezentacji usług, lecz do identyfikacji rozmówcy.

– Biometria głosowa to sposób na weryfikację klienta lub w ogóle dzwoniącego poprzez ocenę próbki jego głosu, które wcześniej zostały zdeponowane w odpowiedniej instytucji. To akurat jest zjawisko, które trochę wolniej się rozwija. Myślę, że tutaj jest kwestia pewnych obaw o bezpieczeństwo takich rozwiązań. Biometrii większość osób nie rozumie, więc obawia się jakichś problemów. Z drugiej strony wchodzą regulacje, które nakazują mieć różne metody weryfikacji klientów, żeby nie bazować właśnie tylko na haśle – wskazuje Bartosz Ziółko.

Tymczasem identyfikacja na podstawie danych biometrycznych połączonych z hasłem może być dużo skuteczniejsza, a zarazem praktycznie niemożliwa do zhakowania. Polska firma Unima2000 oferuje systemy biometrii głosowej skierowane do odbiorców usług finansowych, telekomunikacyjnych czy ochrony zdrowia. Zdaniem przedstawicieli firmy biometria głosowa zapewnia wyższy poziom bezpieczeństwa niż tradycyjne rozwiązania. Współczesne systemy biometrii głosowej są coraz dokładniejsze.

Liderem w rozwoju technologii syntezy mowy są Chiny. Według analityków z Zion Market Research, gdy światowy rynek inteligentnych rozwiązań głosowych rósł w tempie 30 proc. w latach 2016–2017, w Chinach wskaźnik ten wynosił około 70 proc. W ubiegłym roku chiński rynek inteligentnego głosu był wart około 2,3 mld dol.