• Dapps:16,23 тыс.
  • Блокчейны:78
  • Активные пользователи:66,47 млн
  • Объем за 30 дней:303,26 млрд $
  • Транзакции за 30 дней:879,24 млн $

Инновации в безопасности ИИ: новый инструмент для мониторинга цепочки размышлений

user avatar

от Giorgi Kostiuk

6 часов назад


Недавно более 40 ведущих специалистов в области искусственного интеллекта из компаний OpenAI, DeepMind, Google, Anthropic и Meta опубликовали работу, посвященную инструменту безопасности под названием chain-of-thought monitoring. Этот инструмент обещает сделать ИИ более безопасным, следя за процессом принятия решений ИИ.

Что такое chain-of-thought monitoring?

Представленный в статье инструмент chain-of-thought monitoring позволяет разработчикам отслеживать цепочку размышлений ИИ, разбивая задачи на более мелкие шаги и комментируя каждый из них на простом языке. Основная цель заключается в том, чтобы выявлять опасные или некорректные решения в момент их возникновения.

> *«Системы ИИ, которые «думают» на человеческом языке, предлагают уникальную возможность для безопасности искусственного интеллекта: мы можем отслеживать их цепочки размышлений (CoT) в поисках намерения нарушить нормы», — говорится в статье.*

Проблемы и риски в цепочке размышлений ИИ

Исследование также подчеркивает, что прозрачность в процессе размышлений может исчезнуть, если обучение будет сосредоточено только на конечном результате. Разработчики рекомендуют регулярно проверять, сколько из размышлений ИИ остается видимым на каждом этапе работы. Это стало критически важным условием для обеспечения безопасности моделей.

По словам соучредителя Anthropic Джека Кларка, "богатые интроспективные следы будут необходимы для оценки моделей в областях с высокой степенью риска, включая биотехнологические исследования".

Будущее мониторинга цепочки размышлений ИИ

Несмотря на улучшение понимания и производительности моделей, анализ их развернутого мышления обнаружил несоответствия, когда финальный ответ ИИ не совпадал с процессом принятия решений. Исследователи отмечают, что цепочка размышлений ИИ может стать ценным источником информации, даже если она иногда ведет к ошибкам.

Сидни фон Аркс из METR предложила повод для оптимизма, отметив: "Мы должны относиться к цепочке размышлений так, как это может делать военное руководство с перехваченными радиопередачами врага..."

Команда исследователей подчеркнула важность мониторинга цепочки размышлений ИИ, который служит не только для обнаружения ошибок, но и как средство для повышения доверия к технологиям. Это открывает новые горизонты в области разработки безопасного и надежного искусственного интеллекта.

0

Награды

chest
chest
chest
chest

Больше наград

Откройте для себя дополнительные награды в наших социальных сетях.

Другие новости

Конгресс США движется к принятию законопроектов о криптовалюте

chest

Конгресс США продвигает законопроекты, касающиеся криптовалютного рынка и регулирования CBDC, что может повлиять на цифровые активы.

user avatarGiorgi Kostiuk

Палата представителей США инициирует законопроекты GENIUS, Clarity и Anti-CBDC

chest

Законопроекты GENIUS, Clarity и Anti-CBDC прошли голосование в Палате представителей США, что может изменить рынок криптовалют.

user avatarGiorgi Kostiuk

Криптозаконы в США: Конгресс объявил 'Криптону неделю'

chest

Конгресс США продвигает три важные криптозакона после рекордного голосования.

user avatarGiorgi Kostiuk

Золотой крест XRP предвещает бычий тренд и волатильность на рынке

chest

XRP приближается к золотому кресту, SHIB вызывает опасения, а активность биткоин-водяных китов может вызвать краткосрочную волатильность.

user avatarGiorgi Kostiuk

Корейские биржи Bithumb и Upbit приобрели 945 миллионов PENGU

chest

Крупные корейские криптобиржи Bithumb и Upbit увеличили запасы PENGU, что привело к росту его цены на 126%.

user avatarGiorgi Kostiuk

Как Plume строит стратегии для роста на $16 триллионном рынке реальных активов

chest

Plume развивает инфраструктуру для интеграции реальных активов и DeFi, вовлекаясь в регуляторные инициативы в США и Гонконге.

user avatarGiorgi Kostiuk
dapp expert logo
© 2020-2025. DappExpert. Все права защищены.
© 2020-2025. DappExpert. Все права защищены.

Важное примечание: Информация, представленная на портале Dapp.Expert, предназначена исключительно для ознакомительных целей и не является рекомендацией к инвестициям или руководством к действию. Команда Dapp.Expert не несет ответственности за возможные убытки или упущенную выгоду, связанные с использованием материалов, опубликованных на сайте. Перед принятием инвестиционных решений рекомендуем проконсультироваться с квалифицированным финансовым советником.