X

Zapisz się na darmowy newsletter
AI Business

Bądź na bieżąco z możliwościami sztucznej inteligencji w biznesie. Zapisz się na bezpłatny newsletter.

Syntetyczny głos: czy potrafisz odróżnić głos robota od człowieka?

Od 2016 roku Google w ramach sieci neuronowej DeepMind rozwija moduł WaveNet – model sztucznej inteligencji, który ma za zadanie imitować ludzki głos. Ostatnia aktualizacja udowadnia, że już wkrótce rozpoznanie syntetycznego głosu będzie bardzo trudne, a może nawet… niemożliwe?

Głos robota – jak działa WaveNet?

WaveNet została wyposażona w treningową bazę danych zawierającą próbki mowy. Materiał porównawczy posłużył do wytrenowania sieci neuronowej, która wraz z rozwojem algorytmu była w stanie coraz lepiej interpretować realistyczne tony i kształty fali. Tak jak większości nowoczesnych modeli sztucznej inteligencji, każda kolejna próbka była doskonalszym modelem poprzedniego pliku źródłowego. Najnowsza aktualizacja WaveNet ( wersja rozwojowa: Tactron 2) działa w oparciu o spektrogram, który tworzy wizualną interpretację zapisu tekstowego. AI odczytuje zapis spektrogramu i na tej podstawi tworzy zapis audio.

Google chwali się, że już teraz trudno rozpoznać, który głos jest „prawdziwy”, a który to twór sztucznej inteligencji.

Poniżej znajduje się przykład:

Potraficie odróżnić wspomniane nagrania?

Syntetyczny głos – zastosowanie sztucznej mowy

Najnowsza wersja WaveNet została już skutecznie zaimplementowana do Asystenta Google na wszystkich platformach w wersji angielskiej i japońskiej. Wkrótce mają być dostępne kolejne rozszerzenia językowe.

Sztuczna inteligencja coraz lepiej radzi sobie z imitowaniem ludzkich zachowań; inteligentne roboty już wkrótce będą patrolować ulice, a autonomiczne samochody zawsze bezpiecznie zawiozą nas pod wskazany adres.

Stworzenie perfekcyjnego systemu imitującego ludzki głos to kolejny krok rozwojowy, który pozwoli na coraz lepsze „opakowanie” sztucznej inteligencji i zniwelowanie dystansu na linii człowiek-maszyna.
Być może niedługo zniknie chociażby problem oczekiwania na telefonicznego konsultanta, który zostanie nam automatycznie przydzielony przez system i który będzie w stanie prowadzić jednocześnie setki tysięcy rozmów i rozwiązywać problemy związane z abonamentem telefonicznym, rachunkami bankowymi, nie wspominając o inteligentnych asystentach – tutaj zastosowanie jest praktycznie nieograniczone.

Pojawiają się także śmiałe przewidywania, że w przeciągu kilkunastu lat, roboty wyprą tradycyjny model związków i zastąpią człowiekowi życiowego, czy też seksualnego partnera. Czy sztuczna inteligencja o zmysłowym głosie znanej aktorki nauczy się „nas” lepiej niż człowiek i scenariusz z filmu „Her” okaże się rzeczywistością? Czas pokaże. 🙂

Czytaj więcej: Jak oszukać sztuczną inteligencję? To łatwe, ale też rodzi niebezpieczeństwa

Źródła:
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
https://futurism.com/soon-wont-able-difference-between-ai-human-voice/


Porozmawiaj z nami o sztucznej inteligencji
Dołącz do grupy "AI Business" na Facebooku

(Visited 277 times, 1 visits today)

Newsletter
AI Business

Bądź na bieżąco z możliwościami sztucznej inteligencji w biznesie.
Zapisz się na bezpłatny newsletter.



Najnowsze artykuły - AI sztuczna inteligencja

Send this to a friend