Новости из мира высоких технологий

Как это работает? | Синтез речи

В прошлом выпуске мы говорили о распознавании речи, сегодня же обсудим обратную задачу. Итак, как происходит синтез речи, или, иными словами, преобразование произвольного текста в голос — об этом в сегодняшнем выпуске!

Задача синтеза речи решается в несколько этапов. Прежде всего специальному алгоритму необходимо подготовить текст, чтобы роботу было удобно его читать: он записывает все числа словами и расшифровывает сокращения. Затем текст разбивается на отдельные словосочетания, которые нужно читать с непрерывной интонацией — для этого система ориентируется на знаки препинания и устойчивые конструкции.

Далее для всех слов составляется фонетическая транскрипция. Чтобы понять, как читать слово и где поставить в нём ударение, система обращается к встроенным, составленным людьми словарям. Если нужное слово в них отсутствует, компьютер строит транскрипцию самостоятельно, опираясь на академические правила. Если же их оказывается недостаточно, в дело вступают статистические правила: система перебирает записи дикторов и определяет, на какой слог они делали ударение.

Когда транскрипция составлена, компьютер рассчитывает, сколько в ней фреймов, или, иными словами, фрагментов длиной 25 миллисекунд. Далее каждый фрейм описывается множеством параметров: частью какой фонемы он является, какое место в ней занимает, в какой слог входит эта фонема. Также описывается ударность или безударность фонемы, в случае если это гласная. Кроме того, система создает правильную интонацию, используя данные о фразе и предложении.

Затем система задействует акустическую модель, чтобы прочитать подготовленный текст. Она устанавливает соответствия между фонемами с определёнными характеристиками и звуками. Акустическая модель знает, как правильно произнести фонему и придать верную интонацию предложению благодаря машинному обучению. Чем больше данных, на которых учится модель, тем лучше выдаваемый ей результат.

Что же касается голосов, то узнаваемыми их делает, в первую очередь, тембр, который зависит от особенностей строения органов речевого аппарата. Тембр любого голоса можно смоделировать, то есть описать его характеристики — для этого достаточно начитать в студии небольшой объем текстов. После этого данные о тембре можно использовать при синтезе речи на любом языке. Когда системе нужно что-то сказать, она использует генератор звуковых волн — вокодер. В него загружается информация о частотных характеристиках фразы, полученная от акустической модели, а также данные о тембре, который придаёт голосу узнаваемую окраску.

Стоит отметить, что современные технологии синтеза речи имеют некоторые проблемы. Первая их них заключается в искусственности. Любая синтезированная речь воспринимается человеком с трудом, и он вынужден задействовать дополнительные ресурсы для ее понимания. Тем самым люди могут нормально воспринимать синтезированную речь только около 20 минут. Также у синтезированной речи, как правило, отсутствует эмоциональная окраска, и она имеет низкую помехоустойчивость. Иными словами, восприятию синтезированной речи человеку мешают любые, даже самые небольшие посторонние шумы.


Источник: Как это работает? | Синтез речи
Автор:
Теги: Это интересно видео искусственный интеллект Технологии будущего Алгоритм голос

Комментарии (0)

Сортировка: Рейтинг | Дата
Пока комментариев к статье нет, но вы можете стать первым.
Написать комментарий:
Напишите ответ :
От речи зависит здоровье и материальное благополучие
От речи зависит здоровье и материальное благополучие
10
Интересности 08:02 27 авг 2016
Как живут семьи, в которых мужчина не работает
Как живут семьи, в которых мужчина не работает
22
Страничка добра и сплошного жизненного позитива! 09:00 05 июл 2023
Как работает водородная бомба
Как работает водородная бомба
0
Жизнь прекрасна 13:00 31 янв 2017
Удивительный кот-рекордсмен с самым длинным хвостом работает волонтером в местных больницах
Удивительный кот-рекордсмен с самым длинным хвостом работает волонтером в местных больницах
2
УДачные советы 20:00 04 сен 2023
«Не могу сформулировать»: Собчак потеряла дар речи, узнав о совращении Шаляпина бабушкой
«Не могу сформулировать»: Собчак потеряла дар речи, узнав о совращении Шаляпина бабушкой
5
Страничка добра и сплошного жизненного позитива! 17:10 07 сен 2022
Зайдя в комнату в доме друзей, парень потерял дар речи, увидев СВОЙ шкаф…
Зайдя в комнату в доме друзей, парень потерял дар речи, увидев СВОЙ шкаф…
1
Интересный мир 04:35 29 дек 2016
Ни о каких женщинах и речи быть не может. Мне стыдно даже пригласить их к себе
Ни о каких женщинах и речи быть не может. Мне стыдно даже пригласить их к себе
7
Страничка добра и сплошного жизненного позитива! 09:00 02 апр 2023
Главная актриса сериала “Улицы разбитых фонарей” после ДТП лишилась памяти и речи
Главная актриса сериала “Улицы разбитых фонарей” после ДТП лишилась памяти и речи
2
Все о звездах шоубизнеса 18:54 04 апр 2018
12 упражнений для улучшения речи и голоса
12 упражнений для улучшения речи и голоса
0
Сад огород дача и все самое интересное 11:38 30 окт 2018
Она думала, прыщи — это гормональное. Врач потерял дар речи, когда сел за микроскоп!
Она думала, прыщи — это гормональное. Врач потерял дар речи, когда сел за микроскоп!
4
Интересный мир 07:15 23 июн 2017
Знакомая работает в ЗАГСе небольшого городка, иногда рассказывает такое...
Знакомая работает в ЗАГСе небольшого городка, иногда рассказывает такое...
15
Страничка добра и сплошного жизненного позитива! 06:20 05 ноя 2019
50 самых неожиданных ответов на вопрос «Как дела?». Лиши своих друзей дара речи!
50 самых неожиданных ответов на вопрос «Как дела?». Лиши своих друзей дара речи!
19
Интересный мир 09:10 04 апр 2018

Выберете причину обращения:

Выберите действие

Укажите ваш емейл:

Укажите емейл

Такого емейла у нас нет.

Проверьте ваш емейл:

Укажите емейл

Почему-то мы не можем найти ваши данные. Напишите, пожалуйста, в специальный раздел обратной связи: Не смогли найти емейл. Наш менеджер разберется в сложившейся ситуации.

Ваши данные удалены

Просим прощения за доставленные неудобства