Новости из мира высоких технологий

Разработана офлайн-система распознавания речи, работающая с точностью в 97%

Как правило, различные системы распознавания речи, лиц, переводчики и прочие используют огромные серверные мощности для своей работы. А для того, чтобы сделать их доступными для каждого, разработчики передают все данные по интернету, что не дает возможности использовать их в офлайне. Однако современные алгоритмы нейросетей помогают добиться действительно потрясающих результатов. Не так давно Microsoft и Google уже сделали свои переводчики на основе нейросетей полностью независящим от сети, а сейчас настало время алгоритмов распознавания голоса.

За разработку отвечает группа исследователей из Университета Ватерлоо и стартапа под названием DarwinAI. Их технология получила название EdgeSpeechNets.

«В этом исследовании мы используем стратегию создания архитектуры с низким уровнем нагрузки на устройство, но со всеми плюсами подхода с использованием мощной нейросети с глубоким машинным обучением.»

Для начала эксперты создали прототип будущей системы, который выполнял распознавание речи, но обладал ограниченным словарным запасом. При этом он был способен выявлять известные ему ключевые слова даже из очень быстрого потока речи. После этого полученные данные использовались для преобразования звукового сигнала в математическую формулу. Эта формула и использовалась в дальнейшем для проектирования нейросети, которая обладала бы высокой производительностью, но была бы не требовательна к железу.

После этого ученые решили испытать получившуюся программу. Для этого использовалось хранилище Google Speech Commands, которое содержит 65000 1-секундных звуковых образцов. В итоге одна из версий системы, а именно EdgeSpeechNet-D, показала просто отличный результат, достигнув точности в 97% на довольно слабом смартфоне Motorola Moto E c процессором 1,4 ГГц.

«EdgeSpeechNet имеет более высокую точность распознавания при гораздо низких затратах на вычисления. Полученные результаты демонстрируют, что EdgeSpeechNet смогла достичь самой современной производительности, требуя значительно меньше вычислительной мощности, что делает их очень подходящими для использования в мобильных устройствах и приложениях.»

Эту и другие новости вы можете обсудить в нашем чате в Телеграм.


Источник: Разработана офлайн-система распознавания речи, работающая с точностью в 97%
Автор:
Теги: технологии Алгоритмы нейронные сети приложения распознавание речь C D google

Комментарии (0)

Сортировка: Рейтинг | Дата
Пока комментариев к статье нет, но вы можете стать первым.
Написать комментарий:
Напишите ответ :

Выберете причину обращения:

Выберите действие

Укажите ваш емейл:

Укажите емейл

Такого емейла у нас нет.

Проверьте ваш емейл:

Укажите емейл

Почему-то мы не можем найти ваши данные. Напишите, пожалуйста, в специальный раздел обратной связи: Не смогли найти емейл. Наш менеджер разберется в сложившейся ситуации.

Ваши данные удалены

Просим прощения за доставленные неудобства