Недавние сообщения об использовании китайским стартапом DeepSeek всего $6 миллионов на создание AI-модели за два месяца ошеломили разработчиков. Однако новые факты начали прояснять истинную стоимость обучения такой модели.
Реальные затраты на AI-тренинг DeepSeek
Дэвид Сакс, советник Белого дома по вопросам AI и криптовалюты, опроверг заявления о стоимости DeepSeek в $6 миллионов. Согласно отчету аналитика по полупроводникам Дилана Пателя, затраты на обучение этой модели на самом деле составляют более $1 миллиарда. Сумма в $6 миллионов охватывает лишь финальный этап обучения, не учитывая капитальные и исследовательские затраты.
Расходы по версии SemiAnalysis
SemiAnalysis утверждает, что заявленная сумма в $6 миллионов относится только к первоначальному этапу тренинга на графических процессорах. Общая инфраструктура и затраты на исследования оцениваются в $1.3 миллиарда. Также было подмечено, что DeepSeek использует различные графические процессоры, включая H100, H800 и H20. Новая технология эксперта MLA снижает затраты за счет уменьшения потребления кэша на 93.3%.
Воздействие на криптоиндустрию
Эксперты предполагают, что инновации DeepSeek могут существенно повлиять на криптоиндустрию, приводя к повышенному спросу на эффективность и экономию. Это может стимулировать внедрение новых технологий и подходов к масштабированию в различных криптопроектах. Акции AI-токенов уже показали рост после недавних сообщений.
Вне зависимости от истинной стоимости обучения модели DeepSeek, её инновационный подход может открыть новые возможности для криптоиндустрии, требуя от разработчиков большего внимания к эффективности и затратам.