В последнее время искусственный интеллект Google DeepMind с поразительной быстротой обучается все новым и новым функциям. Он уже начал развлекаться,
Правда, в данном случае без участия человека обойтись не удалось. Ученым пришлось инсталлировать в нейросеть продвинутый алгоритм распознавания мимики, после чего DeepMind предстояло «посмотреть» 5 тысяч часов шоу ВВС, таких как BBC Breakfast, Newsnight и Question Time, в которых содержалось около 120 тысяч предложений. В результате этого ИИ научился «читать по губам» даже в тех случаях, когда человек «проглатывает» части слов. После этого началась самая интересная фаза эксперимента. Специалисту по распознаванию речи и искусственному разуму дали возможность посмотреть 200 не связанных между собой фрагментов. В итоге профессионал верно распознал лишь 12,5% слов, в то время как ИИ не ошибся в 46,8% случаев.
Такого эффекта удалось добиться благодаря тому, что в процессе обучения алгоритм распознавания мимики, на который опиралась машина, был основан на достаточно продвинутой
«Все это является огромным шагом на пути к созданию полностью автоматических систем чтения по губам. Это стало возможным только благодаря огромному набору исходных данных, на которых эта система была обучена».
Комментарии (0)