Sonnet 5 продемонстрировала впечатляющие результаты в ряде тестов, что подчеркивает её конкурентоспособность на рынке. В публикации приводится следующая информация: новая версия системы показала высокие оценки, значительно опередив предшественника Sonnet 46.
Результаты тестирования Sonnet 5
В тесте SWEbench Pro Sonnet 5 набрала 632 балла, что на 51 балл больше, чем у Sonnet 46, которая остановилась на отметке 581. Эти данные свидетельствуют о значительном улучшении производительности новой модели.
Сравнение с Opus 48
Кроме того, в тесте GDPvalAA v2 Sonnet 5 показала результат 1,618, что практически идентично показателю Opus 48, который набрал 1,616. Эти результаты подтверждают, что Sonnet 5 способна составить серьезную конкуренцию на рынке, предлагая пользователям высокую эффективность и надежность.
Недавно Фернандо Ирарразаваль провел эксперимент с AI-ассистентом Fiu, выявляя уязвимости в его безопасности, что подчеркивает важность защиты данных в эпоху ИИ. Узнайте подробнее о его методах и результатах здесь.







