Недавнее исследование, проведенное Костой Йордановым в Lenz Research, выявило значительные расхождения в оценках фактов между ведущими AI-системами. Эксперты в публикации акцентируют внимание на том, что результаты работы ставят под сомнение надежность искусственного интеллекта в качестве инструмента для проверки фактов.
Исследование AI-моделей
В ходе исследования пять продвинутых AI-моделей, включая GPT-4 и Claude 2, оценивали 1000 фактических утверждений. В 672 случаях хотя бы одна из моделей отклонилась от мнения большинства, что указывает на отсутствие согласия среди систем.
Вопросы доверия к AI
Эти результаты поднимают важные вопросы о том, насколько можно доверять AI в контексте проверки фактов. Если даже самые современные модели не могут прийти к единому мнению по основным фактам, это может негативно сказаться на их использовании в журналистике и других областях, где точность информации имеет критическое значение.
Согласно отчету UBS, богатые семьи начали сокращать вложения в доллар США из-за низкой уверенности в его стабильности. Это решение контрастирует с недавними выводами о надежности AI в проверке фактов. Читать далее








