Нейросеть может воссоздавать лицо человека по его голосу

Американские ученые из Массачусетского технологического университета разработали специальный алгоритм для нейросети, который способен воссоздать лицо человека по его голосу.

Удивительно, что искусственный интеллект может определить расу, возраст и пол человека. Для того, чтобы обучить нейросеть «рисовать» человеческие лица, ученым пришлось показать ей миллион различных видеоматериалов, на которых было изображено около ста тысяч людей. Программа отдельно работала с видео и аудио дорожками. Основываясь на запоминании многочисленных кадров, нейросеть сначала создавала лицо человека в анфас, после чего проводила анализ спектрограммы звука. По итогам ей удавалось воссоздавать лица говорящих людей.

В результате искусственный интеллект научился определять все черты человеческой внешности, правда с небольшими погрешностями. Естественно, программа еще не доработана и требует дальнейшего изучения. Однако то, что она умеет делать уже сейчас, позволит некоторым технологиям использовать ее для создания анимационных аватаров.

Ранее iReactor сообщал, что российские разработчики использовали нейросеть для «оживления» Достоевского. Ученые представили алгоритм на основе сверточной нейросети, который умеет превращать статичные портреты в анимированное Gif-изображение. Помимо Достоевского, умная система способна оживить любого другого канувшего в небытие знаменитого человека.

Читайте iReactor в Яндексе

0 комментариев
Войдите, чтобы оставить комментарий. Простая в два клика.
Пока никто не оставил комментариев к этой статье. Вы можете стать первым!