OpenAI представила обновленные модели ИИ, направленные на улучшение транскрибации и генерации голоса, что открывает новые перспективы для индустрии криптовалют и блокчейна.
Представление модели GPT-4o
OpenAI анонсировала обновления своих ИИ моделей, посвященные транскрибации и генерации голоса. Эти улучшения направлены на повышение точности, реализма и управляемости. Новые модели, основанные на архитектуре GPT-4o, стремятся поддерживать 'агентные' системы. По словам руководителя продукции OpenAI Оливье Годемонта, планируется создание автономных систем, которые способны самостоятельно выполнять задачи пользователей.
Улучшенная генерация голоса: gpt-4o-mini-tts
Звездой обновления стал новый текст-to-speech модуль 'gpt-4o-mini-tts', который предлагает более реалистичную и настраиваемую генерацию голоса. Разработчики теперь могут управлять произношением и детализацией голоса, создавая более интересные и эмоционально насыщенные AI-взаимодействия.
Новое поколение транскрибации: gpt-4o-transcribe
OpenAI представила 'gpt-4o-transcribe' и 'gpt-4o-mini-transcribe', заменяющие предыдущую модель Whisper. Новые модели обеспечивают улучшенную точность и снижение ошибок, особенно в условиях разнообразных акцентов и шумной окружающей среды. Тем не менее, модели все еще испытывают трудности с некоторыми языками, такими как тамильский и телугу, с уровнем ошибок до 30%.
Обновления моделей ИИ от OpenAI представляют собой значительный шаг вперед в создании более человечных и универсальных AI-систем. Это особенно важно для индустрии криптовалют и блокчейна, где автоматизация и точность играют ключевую роль.