LongCat20 демонстрирует высокую производительность в тестах

от Евгений Дорошенко

час назад

Модель LongCat20 продемонстрировала впечатляющие результаты в тестах на создание игр и решение реальных задач, хотя и не смогла обойти некоторых своих конкурентов. Как следует из официальной информации, эти достижения подчеркивают растущую конкурентоспособность LongCat20 на рынке ИИ.

Результаты тестирования LongCat20 на SWEbench Pro

В тестах на SWEbench Pro модель LongCat20 набрала 595 баллов, что выше показателей GPT-5.5, но ниже результатов Claude Opus 47 и 48. Это свидетельствует о том, что LongCat20 способна справляться с задачами на уровне, сопоставимом с ведущими моделями в индустрии.

Показатели на платформе FORTE

На платформе FORTE LongCat20 показала результат в 732 балла, что соответствует достижениям Claude Opus 46, однако уступает GPT-5.5. Эти результаты подчеркивают потенциал LongCat20 для применения в различных областях, включая:

разработку игр
решение практических задач

Это делает её интересным выбором для разработчиков и исследователей.

Недавно платформа Kalshi столкнулась с юридическими трудностями в Мичигане, что привело к приостановке ее спортивных рынков. Узнайте подробнее о ситуации в нашем материале подробнее.

Награды

Больше наград

Откройте для себя дополнительные награды в наших социальных сетях.

Другие новости

Robinhood запускает публичный мейннет для своей сети Ethereum Layer 2

Брокерская компания Robinhood запустила публичный мейннет своей сети Ethereum Layer 2, Robinhood Chain.

Олег Романов39 минут назад

Robinhood расширяет функционал и географию своих услуг

Юрий Богданов39 минут назад

Venice AI привлек 65 миллионов долларов в первом раунде финансирования

Venice AI, основанная Эриком Вурхизом, привлекла 65 миллионов долларов в своем первом раунде внешнего финансирования.

Артём Савельевчас назад

Токен VVV Venice AI вырос на 11% после объявления о финансировании

Токен VVV Venice AI вырос на 11% после объявления о привлечении финансирования.

Владимир Лисенкочас назад