Китайский аналог Google — компания Baidu — анонсировала
запуск нейронной сети, которая способна лучше и быстрее других программных
аналогов может имитировать любой голос с учетом акцента и фонетических
оттенков.
Предшественнику этой новинки, проект Baidu Deep Voice на
базе искусственного интеллекта требовалось 30-минутное изучение исходного
материала для генерации нового голоса. Инструмент Adobe VoCo делает это за 20
минут, канадский стартап Lyrebird всего за минуту обработки. Новая технология
Baidu, у которой пока нет собственного имени, укладывается в несколько секунд,
сообщает портал «Технокульт» со ссылкой на сообщение компании.
Коммерческий потенциал у такой инновационной разработки
неимоверно широк, и первым делом на ум, разумеется, приходит мошенничество и
фальсификация данных. Клонирование лиц, движений и генерация видео «с участием»
конкретной персоны, де-факто, уже доступно, и может быть даже поставлено на
поток. Достаточно добавить голосовое сопровождение и получить оптимизированную
копию личности, например, для обхода систем биометрической идентификации.
Но есть примеры позитивного использования новинки. Вполне —
«одушевленный» электронный помощник, который говорит голосом любимого
персонажа. Цифровая нянька, способная успокоить ребенка или домашнего питомца
голосом старшего члена семьи. Возможность привычного общения для человека,
который утратил способность говорить, пусть и временно. Запись аудиокниг или
озвучка текста известным голосом без необходимости утруждать его обладателя.