ElevenLabs, компания, занимающаяся искусственным интеллектом, выпустила модель преобразования речи в текст — Scribe, представляющую собой их официальный выход на этот рынок.
Прорыв ElevenLabs в преобразовании речи в текст
Компания ElevenLabs вошла на рынок самостоятельных моделей преобразования речи в текст с продуктом Scribe, конкурируя с лидерами отрасли, такими как Gladia, Speechmatics и OpenAI's Whisper. Scribe поддерживает более 99 языков и обеспечивает высокую точность в ключевых языках, таких как английский, французский, немецкий, японский и другие.
Особенности и возможности Scribe
Scribe предлагает ряд новшеств, включая 'умную' диаризацию говорящих, отметки временных меток на уровне слова, а также автоматическое распознавание звуковых событий. Эти функции улучшают качество транскрипции и делают ее более информативной. Также Scribe интегрирован в студию ElevenLabs для прямого перевода видео в субтитры.
Цены и конкурентоспособность Scribe
Стоимость использования Scribe составляет $0.40 за час транскрибируемого аудио, что является конкурентоспособной ценой на рынке. Однако пользователи должны учитывать не только стоимость, но и функции, а также точность распознавания языка при выборе продукта для своих нужд.
Выход Scribe на рынок укрепляет позиции ElevenLabs как значимого игрока в сфере преобразования речи в текст, предлагая широкий спектр языковой поддержки и новые инновационные функции.