Искусственный интеллект научился синтезировать шумы, которые люди не в состоянии отличить от естественных. Ученые из Лаборатории искусственного интеллекта Массачусетского технологического института разработали алгоритм, способный озвучивать видеоролики, снабжая их шумовыми эффектами. Для обучения ИИ исследователи показали ему около 1000 видеофрагментов, содержащих 46 000 различных шумов, которые производились при помощи барабанной палочки.
«Чтобы озвучить какой-либо эпизод, алгоритм анализирует звуковые характеристики исходного фрагмента и сравнивает их с семплами, которые хранятся в базе данных. Когда подходящий шум найден, система вставляет его в аудиодорожку ролика, аккуратно «сшивая» его с соседними звуками», — объяснил аспирант Эндрю Оуэнс (Andrew Owens), один из авторов разработки.
Когда видеоролики, озвученные ИИ, показывали добровольцам, те в большинстве случаев не могли распознать «подлога».
Искусственный интеллект затирает исходные шумы в ролике, заменяя их ударами и скрипами барабанной палочки. По мнению Оуэнса и его коллег, алгоритм можно будет использовать для создания звуковых эффектов в кино. Однако у исследования есть и более фундаментальное значение — ученые считают, что они разработали методику, которая позволит роботам эффективнее знакомиться с окружающим миром.
«Когда вы стучите пальцем по бокалу, звук позволяет понять, сколько в нем содержится жидкости. ИИ, который учится воспроизводить такие звуки, одновременно получает представление о форме и свойствах объектов материального мира», — сказал Оуэнс.
Комментарии (3)