Французская компания Mistral анонсировала выход новой аудио ИИ-модели Voxtral, которая нацелена на бизнес и предлагает уникальные возможности в области обработки речи.
Инновационные возможности Voxtral
Voxtral предназначен для обеспечения практической речевой интеллигенции в реальных приложениях и превосходит Whisper large-v3, одну из лучших открытых моделей для транскрипции аудио.
Варианты и характеристики моделей
Модель Voxtral работает на базе большого языкового модели Mistral Small 3.1 и может обрабатывать множество языков, таких как английский, французский, испанский и многие другие. Voxtral может транскрибировать до 30 минут аудио и обрабатывать до 40 минут, позволяя пользователям проводить беседы и задавать вопросы.
Будущее аудио ИИ от Mistral
Mistral выпустила две версии модели: Voxtral Small с 24 миллиардами параметров и Voxtral Mini с 3 миллиардами параметров. Оба варианта доступны для скачивания и локального хостинга, и их интеграция в приложения осуществляется через единый API вызов.
Voxtral от Mistral представляет собой значительный шаг вперед в области аудио ИИ, обеспечивая высокое качество обработки речи и расширенные функциональные возможности для бизнеса.