Разработан способ почти мгновенного копирования любого голоса
Это опять искусственный интеллектПодделать чей-то голос — задача, с которой технологии уже давно могут справиться. Вопрос только в том, сколько минут или часов входных данных, то есть записи речи человека, им для этого понадобится. Разработчики представили систему, которой для копирования голоса будет достаточно пяти секунд входных данных.
Авторы программы-генератора речи опубликовали примеры здесь. Результат действительно впечатляет: отличить синтезированный голос от реального почти невозможно.
Для работы программы требуются три компонента. Первый — нейросеть, которая кодирует речь говорящего. Её обучали на тысячах образцах. Второй — синтезатор, который переводит данные в спектрограмму. Третий — вокодер, которые создаёт речь.
Особенность программы в том, что она способна имитировать говорящего человека, даже если его голос не использовался для обучения нейросети.
Автор:Ксения Мурашева