Rynek usług syntezy mowy do 2022 roku osiągnie wartość ponad 3 mld dolarów. Pionierami w tej dziedzinie są Polacy

Rynek usług syntezy mowy do 2022 roku osiągnie wartość ponad 3 mld dolarów. Pionierami w tej dziedzinie są Polacy

Rynek usług syntezy mowy do 2022 roku osiągnie wartość ponad 3 mld dolarów. Pionierami w tej dziedzinie są Polacy 1

Wartość rynku usług syntezy mowy wzrośnie do 3,03 mld dolarów w 2022 roku. Średnioroczny wzrost na poziomie ponad 15 proc. wskazuje na bardzo dynamiczny rozwój tego rynku. Pomaga w tym równie dynamiczny rozwój segmentu sztucznej inteligencji, na której usługi syntezy mowy opierają swoje działanie. Pionierami w tej dziedzinie są Polacy.

Według  raportu „Text-to-Speech Market by Vertical and Geography – Global Forecast to 2022” skumulowany roczny wskaźnik wzrostu na rynku syntezy mowy w latach 2017–2022 ma wynieść 15,21 proc., by do roku 2022 przekroczyć wartość 3 mld dolarów. Systemy text2speech są powszechnie używane w smartfonach do nawigacji i wspomagania pracy wirtualnych asystentów. Znajdziemy je w komputerach i telewizorach, gdzie pomagają osobom niewidomym i słabo widzącym podczas nawigacji po menu czy przeglądania stron internetowych. Pionierami w tej dziedzinie są Polacy.

– Możemy wrzucić do chmury tekst w prawie 30 językach z całego świata, powiedzieć, w jakim głosie powinno być to powiedziane, a to, co zrobi nam chmura, to wygeneruje plik audio mp3 z danym tekstem. Co ciekawe, jest to usługa, która została utworzona w Polsce, w Gdańsku. Mamy usługę zrobioną przez Polaków, z której korzysta cały świat – mówi w wywiadzie dla agencji informacyjnej Newseria Informacje Tomasz Stachlewski z Amazon Web Services.

Zdaniem 63 proc. menadżerów ankietowanych przez PWC w raporcie „Bot.Me: A revolutionary partnership. How AI is pushing man and machine closer together”, dzięki sztucznej inteligencji możemy liczyć na poprawę interakcji z urządzeniami. Ponadto konsumenci coraz mniej zwracają uwagę na to, czy komunikują się z człowiekiem czy z systemem sztucznej inteligencji. Usługi text2speech opierają się na algorytmach sztucznej inteligencji.

– Wykorzystujemy usługi sztucznej inteligencji po to, aby w najbardziej realistyczny sposób konwertować tekst na audio, zatem nie chodzi o przeczytanie sylab, słów, ale musimy wykrywać kontekst, aby wiedzieć, kiedy zaintonować, kiedy się zatrzymać, kiedy dać znak zapytania – wyjaśnia Tomasz Stachlewski.

Analitycy z firmy Tractica szacują, że wartość całego rynku SI dla przedsiębiorstw wzrośnie z 1,6 mld dolarów w roku ubiegłym do niemal 60 mld dolarów w 2025 roku. W swoim raporcie wymieniają ponadto sektory reklamy, finansów, opieki zdrowotnej, a także przemysł lotniczy i kosmiczny jako te, które będą liderami w stosowaniu rozwiązań SI. Jak jednak podkreślają, należy się liczyć z silnym wzrostem zainteresowania rozwiązaniami SI w niemal każdym sektorze gospodarki.

– Rośnie zapotrzebowanie na usługi wykorzystujące sztuczną inteligencję, coraz więcej systemów, aplikacji, ma mieć właśnie tę cząstkę sztucznej inteligencji, text2speech jest właśnie takim przykładem, coraz więcej firm pragnie to wykorzystywać. W grach komputerowych nie potrzebujemy lektorów, którzy będą nagrywać tekst, nagle technologia zamiany dowolnego tekstu na audio jest dostępna na wyciągnięcie ręki więc gry, strony internetowe, możemy robić w ten sposób, aby komunikowały się z użytkownikami – wyjaśnia ekspert.

Systemy sztucznej inteligencji dopiero zaczynają się rozwijać, choć jak wynika z przytaczanych raportów, ich rozwój będzie niezwykle dynamiczny, a SI w takiej czy innej formie pojawi się w zasadzie w każdym aspekcie naszego życia.

– Trudno mówić o prognozach, to klienci pokazują, czego oczekują i jak będzie się kształtował rynek. Naszym zadaniem jest dostarczać te rzeczy, których potrzebują i z których będą budować nowe funkcjonalności – podsumowuje przedstawiciel Amazon Web Services.