В Google создали самый совершенный алгоритм синтеза речи

Материал из Викиновостей, свободного источника новостей

28 декабря 2017 года

Группа разработчиков из компании Google представила систему синтеза речи, которая способна преобразовывать текст в речь, максимально приближенную к человеческой. Описание алгоритма, получившего название Tacotron 2, доступно на сайте ArXiv.org, а примеры его работы можно найти на сайте компании.

Как пишет N+1, Google уже давно ведет разработки в области синтеза речи. Новый алгоритм работает на основе двух нейронных сетей. Первая нейросеть разбивает текст на отдельные токены (буквы, паузы и знаки препинания) и визуализирует их в виде спектрограмм, а вторая синтезирует на основе этих спектрограмм аудио, используя алгоритмы WaveNet, которые учитывают различные языковые параметры, включая длину слов в тексте и их слогов.

По словам создателей, Tacotron 2 заметно превосходит существующие аналоги. Так, алгоритм способен определять омонимы, исходя из контекста, делать паузы на месте знаков препинания или акценты на словах, написанных заглавными буквами. В итоге синтезированная речь практически не отличается от настоящей.

Чтобы оценить качество синтезируемой речи, создатели алгоритма пригласили восьмерых добровольцев и попросили их прослушать оригинальные записи речи и их синтезированные варианты, оценив образцы по шкале от одного до пяти баллов, где пять означает, что запись максимально похожа на человеческую речь. В итоге средний балл, полученный образцами работы Tacotron 2, составил 4,53, а записи настоящей речи получили 4,58 балла.

Как полагают разработчики Tacotron 2, алгоритм может быть использован для улучшения работы голосовых помощников, которые получают все более широкое распространение.

Источники[править]

Creative Commons
Creative Commons
Эта статья содержит материалы из статьи «В Google создали самый совершенный алгоритм синтеза речи», опубликованной NEWSru.com и распространяющейся на условиях лицензии Creative Commons Attribution 4.0 (CC BY 4.0) — при использовании необходимо указать автора, оригинальный источник со ссылкой и лицензию.
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии[править]

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.