Модель LongCat20 продемонстрировала впечатляющие результаты в тестах на создание игр и решение реальных задач, хотя и не смогла обойти некоторых своих конкурентов. Как следует из официальной информации, эти достижения подчеркивают растущую конкурентоспособность LongCat20 на рынке ИИ.
Результаты тестирования LongCat20 на SWEbench Pro
В тестах на SWEbench Pro модель LongCat20 набрала 595 баллов, что выше показателей GPT-5.5, но ниже результатов Claude Opus 47 и 48. Это свидетельствует о том, что LongCat20 способна справляться с задачами на уровне, сопоставимом с ведущими моделями в индустрии.
Показатели на платформе FORTE
На платформе FORTE LongCat20 показала результат в 732 балла, что соответствует достижениям Claude Opus 46, однако уступает GPT-5.5. Эти результаты подчеркивают потенциал LongCat20 для применения в различных областях, включая:
- разработку игр
- решение практических задач
Это делает её интересным выбором для разработчиков и исследователей.
Недавно платформа Kalshi столкнулась с юридическими трудностями в Мичигане, что привело к приостановке ее спортивных рынков. Узнайте подробнее о ситуации в нашем материале подробнее.








