Команда Andon Labs провела интересный эксперимент, который выявил ограничения больших языковых моделей (LLM) в выполнении физических задач. В рамках исследования был использован вакуумный робот, которому была поставлена задача 'передать масло'.
Неутешительные результаты эксперимента
Результаты эксперимента оказались неутешительными для разработчиков LLM. Даже самые современные модели, такие как Gemini 1.5 и Claude 2, продемонстрировали лишь 40% и 37% точности выполнения задачи соответственно. Эти цифры подчеркивают значительные недостатки в способности языковых моделей взаимодействовать с физической средой.
Важность эксперимента для понимания LLM
Эксперимент стал важным шагом в понимании возможностей и ограничений LLM, особенно в контексте их применения в робототехнике. Несмотря на впечатляющие достижения в области обработки языка, результаты показывают, что для успешного выполнения физических задач требуется гораздо больше, чем просто алгоритмы обработки данных.
31 октября 2025 года Deutsche Telekom стала первым оператором валидатора в Theta Network, что подчеркивает важность сотрудничества в блокчейн-индустрии. Узнайте больше о данном событии в нашей статье подробнее.








