AI-модели не смогли превзойти инженеров в тестах на анализ инцидентов

от Эмиль Юнусов

2 месяца назад

Недавнее исследование, проведенное Datadog и Carnegie Mellon, выявило значительные ограничения современных AI-моделей в области анализа временных рядов. В ходе тестирования ARFBench, основанного на реальных инцидентах, стало очевидно, что искусственный интеллект пока не может соперничать с человеческими экспертами, как указано в публикации.

Результаты исследования AI-моделей

В рамках исследования были проанализированы 63 реальных инцидента, и результаты показали, что AI-модели, включая GPT-4, не смогли превзойти уровень точности, достигнутый специалистами. GPT-4 продемонстрировал наилучший результат среди всех AI, достигнув 62.7% точности, в то время как эксперты смогли добиться 72.7%.

Важность взаимодействия человека и машины

Эти данные подчеркивают важность взаимодействия между человеком и машиной в процессе анализа инцидентов. Несмотря на прогресс в области искусственного интеллекта, результаты исследования свидетельствуют о том, что человеческий опыт и интуиция остаются незаменимыми в сложных ситуациях, требующих глубокого анализа и понимания контекста.

В то время как исследование AI-моделей выявило их ограничения в анализе инцидентов, Банк Англии анонсировал важные изменения в расчетной системе, включая запуск живой синхронизации. Узнайте подробнее о планах банка здесь.

Награды

Больше наград

Откройте для себя дополнительные награды в наших социальных сетях.

Другие новости

Акции Apple открылись с падением на фоне внимания к сектору технологий

Акции Apple открылись на уровне 321 после снижения, в то время как акции технологических компаний находятся под увеличенным вниманием из-за роста капитальных затрат на искусственный интеллект.

Павел Коваль16 часов назад

BitMEX сталкивается с предложенным коллективным иском в Нью-Йорке

BitMEX подал в суд на возврат 62266 BTC из-за предположительных принудительных ликвидаций и misconduct на платформе.

Светлана Литвиновадень назад

Hyperliquid впервые превзошел объем торгов криптовалютами

Торговая платформа Hyperliquid зафиксировала рекордный объем торгов реальными активами, превысив объем торгов криптовалютами.

Вера Джафаровадень назад

Samsung Wallet добавит поддержку стейблкоинов

На мероприятии Galaxy Unpacked в Лондоне Samsung анонсировала добавление поддержки стейблкоинов в приложение Samsung Wallet.

Андрей Колесниковдень назад

Anthropic представила Claude Opus 5, новую модель AI

Сегодня компания Anthropic анонсировала выпуск Claude Opus 5, новой модели искусственного интеллекта, которая предлагает более низкие затраты для бизнеса и превосходит предыдущую модель Fable 5 по важным показателям.