Для работы системе нужна аудиозапись выступления президента Обамы и немного свободного времени. Учёные предварительно скормили нейронной сети несколько часов видеозаписей бывшего президента, чтобы она смогла изучить его мимику и выявить основные её моменты для дальнейшей работы. И вуаля! На выходе мы получаем президента Обаму, который на камеру произносит фразы, произнесённые им на каком-нибудь ток-шоу или где-то ещё. В данном случае, конечно, лучше всего увидеть всё это своими собственными глазами. Так как объяснить такое на словах – задача не из лёгких.
Ассистент профессора Университета Вашингтона Ира Кемельмахер-Шлицерман объясняет, что данная технология может быть полезна в нескольких областях. Например, в виртуальной реальности, речь человека может быть практически идеально перенесена на его компьютерного аватара. Подобный подход может серьёзно облегчить жизнь разработчикам видеоигр, которые используют для захвата мимики человека весьма сложные и дорогостоящие технологии. А здесь вам всего-то нужно записать голос человека и скормить запись нейронной сети.
Пока ещё система далека от совершенства. Ведь предварительно ей необходимо тщательно изучить мимику человека, а для этого понадобятся несколько часов видеозаписей. Но создатели технологии считают, что в будущем процесс удастся значительно упростить. Данную технологию более подробно продемонстрируют публике в рамках выставки SIGGRAPH 2017, которая начнётся в следующем месяце.
Комментарии (0)