Новости из мира высоких технологий

Как это работает? | Распознавание речи

Первое устройство для распознавания речи появилось в 1952 году, оно могло понимать произнесённые человеком цифры. 40 лет спустя были представлены первые коммерческие программы, распознающие речь человека. Они были предназначены для людей, которые в силу физиологических особенностей не могли набирать текст вручную. Сейчас же функция распознавания речи есть практически в любом смартфоне, она позволяет нам взаимодействовать голосом с приложениями, облегчая и упрощая нашу жизнь. Как же работает распознавание речи — об этом в сегодняшнем выпуске.

Если произнести голосовой запрос, например, адрес места назначения, смартфон услышит не улицу и номер дома, а звуковой сигнал, в котором звуки плавно перетекают друг в друга, не имея чётких границ. Задача системы распознавания речи — восстановить по этому сигналу то, что было сказано. Стоит отметить, что одна и та же фраза, произнесённая разными людьми в разной обстановке, будет давать совершенно непохожие друг на друга сигналы. Правильно их интерпретировать помогает система акустического моделирования.

После произнесения голосового запроса он записывается смартфоном и отправляется на серверы, где определяется уровень помех и происходит шумоотчистка и отделение полезного сигнала. Затем запись разделяется на маленькие фрагменты (фреймы), например, длиной 25 миллисекунд с шагом 10 миллисекунд, то есть внахлёст. Таким образом из одной секунды речи получается сто фреймов.

Сначала каждый фрейм пропускается через акустическую модель. Система с машинным обучением, определяет варианты произнесенных слов и контекст. Точность результатов напрямую зависит от полноты фонетического алфавита системы. Для каждого звука изначально строится сложная статистическая модель, которая описывает произнесение этого звука в речи. Система распознавания сопоставляет входящий речевой сигнал с фонемами, а уже из них собирает слова. Например, фонетический алфавит Яндекса состоит из 4000 элементарных единиц, которые включают фонемы, их части и сочетания. Каждый фрейм сопоставляется не с одной фонемой, а с несколькими, подходящими с разной степенью вероятности. Кроме того, система учитывает вероятности переходов, то есть определяет, какие фреймы могут идти следом за конкретной фонемой. Для этого применяются данные о произношении, морфологии и семантике. Таким образом система подбирает варианты слов, которые затем анализирует на формы, части речи и возможные статистические связи между ними.

Далее в процесс вступает языковая модель, при помощи которой система определяет вероятный порядок слов и при необходимости восстанавливает нераспознанные слова по смыслу, исходя из контекста и имеющейся статистики.

В результате полученная информация поступает в основной блок системы распознавания — декодер. Этот программный компонент совмещает данные от акустических и языковых моделей и на основании их объединения выдает конечный результат в виде наиболее вероятной последовательности слов.

Благодаря машинному обучению системы устойчивы к шуму и умеют распознавать речь с акцентом. Точность современных систем распознавания речи превышает 90 процентов.


Источник: Как это работает? | Распознавание речи
Автор:
Теги: Это интересно видео Высокие технологии искусственный интеллект Блок быль

Комментарии (0)

Сортировка: Рейтинг | Дата
Пока комментариев к статье нет, но вы можете стать первым.
Написать комментарий:
Напишите ответ :
От речи зависит здоровье и материальное благополучие
От речи зависит здоровье и материальное благополучие
10
Интересности 08:02 27 авг 2016
Как живут семьи, в которых мужчина не работает
Как живут семьи, в которых мужчина не работает
22
Страничка добра и сплошного жизненного позитива! 09:00 05 июл 2023
«Не могу сформулировать»: Собчак потеряла дар речи, узнав о совращении Шаляпина бабушкой
«Не могу сформулировать»: Собчак потеряла дар речи, узнав о совращении Шаляпина бабушкой
5
Страничка добра и сплошного жизненного позитива! 17:10 07 сен 2022
Зайдя в комнату в доме друзей, парень потерял дар речи, увидев СВОЙ шкаф…
Зайдя в комнату в доме друзей, парень потерял дар речи, увидев СВОЙ шкаф…
1
Интересный мир 04:35 29 дек 2016
Ни о каких женщинах и речи быть не может. Мне стыдно даже пригласить их к себе
Ни о каких женщинах и речи быть не может. Мне стыдно даже пригласить их к себе
7
Страничка добра и сплошного жизненного позитива! 09:00 02 апр 2023
12 упражнений для улучшения речи и голоса
12 упражнений для улучшения речи и голоса
0
Сад огород дача и все самое интересное 11:38 30 окт 2018
Главная актриса сериала “Улицы разбитых фонарей” после ДТП лишилась памяти и речи
Главная актриса сериала “Улицы разбитых фонарей” после ДТП лишилась памяти и речи
2
Все о звездах шоубизнеса 18:54 04 апр 2018
Удивительный кот-рекордсмен с самым длинным хвостом работает волонтером в местных больницах
Удивительный кот-рекордсмен с самым длинным хвостом работает волонтером в местных больницах
2
УДачные советы 20:00 04 сен 2023
Она думала, прыщи — это гормональное. Врач потерял дар речи, когда сел за микроскоп!
Она думала, прыщи — это гормональное. Врач потерял дар речи, когда сел за микроскоп!
4
Интересный мир 07:15 23 июн 2017
Знакомая работает в ЗАГСе небольшого городка, иногда рассказывает такое...
Знакомая работает в ЗАГСе небольшого городка, иногда рассказывает такое...
15
Страничка добра и сплошного жизненного позитива! 06:20 05 ноя 2019
50 самых неожиданных ответов на вопрос «Как дела?». Лиши своих друзей дара речи!
50 самых неожиданных ответов на вопрос «Как дела?». Лиши своих друзей дара речи!
19
Интересный мир 09:10 04 апр 2018
5 заброшенных суперпроектов СССР, один вид которых отнимает дар речи
5 заброшенных суперпроектов СССР, один вид которых отнимает дар речи
1
Интересный мир 23:00 08 мар 2017

Выберете причину обращения:

Выберите действие

Укажите ваш емейл:

Укажите емейл

Такого емейла у нас нет.

Проверьте ваш емейл:

Укажите емейл

Почему-то мы не можем найти ваши данные. Напишите, пожалуйста, в специальный раздел обратной связи: Не смогли найти емейл. Наш менеджер разберется в сложившейся ситуации.

Ваши данные удалены

Просим прощения за доставленные неудобства