Пока очень ограниченному количеству пользователей.
OpenAI начала открывать доступ к «продвинутому» голосовому режиму в чат-боте для пользователей с подпиской ChatGPT Plus, пишет The Verge. Компания показала его возможности на презентации GPT-4o в мае 2024 года.
В частности, во время демонстрации спикеры могли прервать чат-бота на середине ответа, чтобы что-то уточнить, и просили его рассказать историю «драматично», голосом робота или пропеть её.
Альфа-версия этого режима должна была запуститься в конце июня 2024 года, но OpenAI отложила запуск. Разработчики объясняли, что «улучшают способность модели обнаруживать и отклонять определённый контент».
В частности, они добавили фильтры для блокировки некоторых запросов на создание музыки или другого защищённого авторским правом аудиоконтента.
После демонстрации пользователи соцсетей отмечали, что голос Sky сильно похож на актрису Скарлетт Йохансон и напоминает её персонажа из фильма «Она». В OpenAI голос убрали.
Новый режим ChatGPT будет использовать только четыре голоса, созданных с помощью актёров озвучивания, рассказали The Verge в компании. Чат-бот не сможет подражать голосам других людей, утверждают в OpenAI. Для всех пользователей ChatGPT Plus разработчики планируют открыть режим осенью 2024 года.
ИСТОЧНИК: VC