Инженеры из китайской компании Baidu обучили искусственный интеллект копировать человеческий голос. Об этом сообщается на сайте Digital Trends, передает Regnum.
Ученые создали технологию имитации речи, обучение которой проходило посредством аудиозаписи длительностью в 800 часов, содержавшей более 2400 образцов человеческого голоса. Технология получила название Deep Voice.
Программа научилась не только подражать голосам, но и с точностью копировать их тембр и интонацию. Кроме того, нейросеть умеет менять голос с женского на мужской, а также говорить с иностранным акцентом.
По мнению авторов, технология будет востребована в различных сферах деятельности. Например, она способна за минуту обойти системы распознавания голоса. Также с помощью Deep Voice можно озвучивать книги и другие программы, переводить фильмы.