Войти в почту

Японцы научили нейросеть озвучивать картины и фото. Видео

Команда программистов из Токийского университета разработала нейросеть Imaginary Soundscape, которая умеет озвучивать картины и фотографии. Любой интернет-пользователь может загрузить в нее изображение и посмотреть, как оно будет звучать, сообщает The Verge. Нейросеть обнаруживает на картинке знакомые ей элементы и подбирает к ним звуки из базы, в которой хранятся 52 тысячи аудиофайлов. К примеру, так звучат картины "Хьюго Рейсингер" Андреса Цорна, "Базиль и Камилла" Клода Моне, "Женщина гладит" Эдгара Дега. Журналисты отмечает, что в настоящий момент программа успешно озвучивает изображения, на которых люди что-то делает, а с абстрактными полотнами (в том числе, с мемами) пока справляется неважно. Ранее авторы проекта разработали нейросеть, которая умеет озвучивать панорамы Google Maps.