Он синтезирует речь по одной фразе и передаёт интонацию реального человека.
На облачной платформе Yandex Cloud появился сервис Brand Voice Call Center, рассказали в компании.
Алгоритм способен обработать аудиошаблон и создать на его основе сотни других реплик. При этом его можно научить обращаться к собеседнику по имени или согласовывать адреса и набор товаров в заказе. В сгенерированных фразах также можно менять отдельные слова.
Речь, сгенерированная с помощью Brand Voice Call Center, звучит естественно и передаёт детали речи человека из шаблона: интонации, изменения громкости. А в качестве образцов можно использовать записи реальных разговоров операторов колл-центров.
Для обучения алгоритма использовали тысячи часов записей русскоязычных дикторов. Это позволяет работать практически с любым голосом без предварительной подготовки.
Клиенты сервиса должны будут платить только за запросы — бюджет на обучение и поддержку алгоритма не потребуется. Перечень тарифов и их стоимость в компании не раскрыли.
В июле 2021 года «Яндекс» запустил Yandex SpeechKit Brand Voice — сервис для создания фирменных голосов виртуальных помощников. Стоимость его использования начинается от 13,2 рубля за 10 тысяч символов в месяц.
Также у компании есть сервис Brand Voice Premium, он позволяет синтезировать голоса для маркетинговых и PR-компаний.
ИСТОЧНИК: VC