Год назад OpenAI анонсировала революционную технологию клонирования голосов, но она до сих пор не вышла в массовое использование. Что стоит за этой задержкой?
Почему задерживается Voice Engine?
Прошло более года с тех пор, как OpenAI представила свою технологию Voice Engine. Изначально планировалась её ограниченная реализация в сотрудничестве с избранными партнёрами для тестирования. Причинами задержки считаются:
1. Забота о безопасности: Синтетические голоса могут быть использованы для мошенничества и подделок.
2. Внимание регуляторов: AI технологии требуют внимательного изучения для избежания излишних регламентаций.
3. Обучение и корректировка: OpenAI заявляет, что она учится на реальных примерах использования технологии партнёрами для дальнейшего улучшения её безопасности и полезности.
Как работает AI Voice Cloning Tool?
Voice Engine — это не просто текст-в-речь инструмент. Это мощная технология, которая может создавать естественно звучащий голос. Работает она следующим образом:
1. Прогнозирование звуков: Модель прогнозирует возможные звуки, которые произнесет спикер на основании текста.
2. Учет особенностей: Она учитывает различные голоса, акценты и стили речи.
3. Синтез речи: Генерируется не только текст, но и интонации, делающие речь более естественной.
Будущее технологий синтетических голосов
OpenAI приняла решение отложить массовый запуск Voice Engine из-за вопросов безопасности. В своем блоге компания акцентировала внимание на важности ответственности при предоставлении новых технологий обществу. Примером тесного сотрудничества является Livox, которая работает над улучшением коммуникационных устройств для людей с ограниченными возможностями. Однако Livox столкнулась с проблемой использования Voice Engine из-за требований онлайн-доступа.
Будущее Voice Engine остается неопределённым. Может быть, она получит массовый доступ в ближайшее время, а может остаться в ограниченном формате. OpenAI ставит свои приоритеты в плане безопасного и ответственного развертывания технологии.