DeepSeek v3.1 лидирует в бенчмарке AI-Trader по торговле акциями Nasdaq-100, но результат требует контекста
В открытом проекте AI-Trader за первые недели работы DeepSeek v3.1 показал рост портфеля на 16,46% — выше других ИИ и пассивного индекса QQQ (+5,39%). Однако тест проводится в учебной среде с упрощёнными условиями: доступ к новостям без точных временных меток, исполнение ордеров по цене открытия дня, короткий период и благоприятный тренд на рынке техносектора.
С 1 октября 2025 года в сети работает открытый бенчмарк AI-Trader, где несколько популярных языковых моделей управляют виртуальным портфелем в $10 000, торгуя бумагами из индекса Nasdaq-100. Моделям предоставляется доступ к рыночным данным и свежим новостям, чтобы принимать решения на основе фундаментального и событийного анализа.
На момент анализа лидером стал DeepSeek v3.1, чей портфель вырос на +16,46%. Второе место — у MiniMax-M2 (+12,03%), третьи — GPT-5 (+9,98%) и Claude 3.7 Sonnet (+9,8%). Qwen3-max показал средний результат (+7,96%), а Gemini 2.5-flash, несмотря на высокую активность (наибольшее количество сделок), заработал лишь +0,48%.

Для сравнения добавлен пассивный подход — полное копирование структуры ETF QQQ, который показал прирост +5,39%. Это подтверждает: успех DeepSeek не объясняется исключительно ростом рынка — модель выбрала более доходную стратегию распределения капитала.

Однако результаты требуют интерпретации:
— Торговля ведётся в учебной среде, где нет реальных рисков ликвидности, проскальзывания или изменения волатильности;
— Ордера исполняются по цене открытия торгового дня, что исключает влияние времени входа и снижает сложность управления рисками;
— Доступ к новостям не всегда временно привязан — некоторые материалы поступают в систему без даты, что теоретически может позволить модели использовать информацию, опережающую временной горизонт торговли;
— Период тестирования — очень короткий, менее месяца;
— Рынок находится в выраженном бычьем тренде, особенно в технологическом секторе: достаточно было увеличить долю Nvidia, Microsoft и ASML, чтобы обогнать индекс.

Это означает, что текущий результат — не полная проверка устойчивости стратегии, а скорее демонстрация способности модели собирать и интерпретировать сигналы, действовать решительно и эффективно перераспределять активы в условиях растущего рынка.

Успех DeepSeek может быть связан с её архитектурой: она обучена на данных, включающих финансовые отчёты, аналитические обзоры и историю фондовых движений, что делает её чувствительной к ключевым триггерам — например, выходу новых чипов, изменению прогнозов доходов или макроэкономическим сигналам.

Пока проект не является надёжным индикатором долгосрочной эффективности. Он показывает, как модели ведут себя в стабильных, предсказуемых условиях, но не проверяет их поведение при падении рынка, шорт-игре, управлении убытками или работе с ограниченной ликвидностью.

Если разработчики AI-Trader доработают методику — переведут торговлю на почасовой цикл, ограничат доступ к новостям по времени, введут комиссии и проскальзывание — это позволит создать более жёсткий бенчмарк. Такой подход будет ближе к реальности и поможет оценить не только доходность, но и зрелость моделей: их способность контролировать риск, адаптироваться к медвежьим трендам и сохранять капитал.

Пока же лидерство DeepSeek — важный сигнал: он демонстрирует, что модели, ориентированные на анализ текста и принятие решений, могут превосходить как пассивные стратегии, так и западные аналоги. Но для настоящего доверия им нужно пройти испытания в условиях, где цена ошибки — не ноль, а реальные убытки.
© 31.10.2025
Контакты:
info@smartinfra.ru
105118, г. Москва,
ул. Буракова, 27 к3,
3 этаж, офис 322

© 2025