На момент анализа лидером стал DeepSeek v3.1, чей портфель вырос на +16,46%. Второе место — у MiniMax-M2 (+12,03%), третьи — GPT-5 (+9,98%) и Claude 3.7 Sonnet (+9,8%). Qwen3-max показал средний результат (+7,96%), а Gemini 2.5-flash, несмотря на высокую активность (наибольшее количество сделок), заработал лишь +0,48%.
Для сравнения добавлен пассивный подход — полное копирование структуры ETF QQQ, который показал прирост +5,39%. Это подтверждает: успех DeepSeek не объясняется исключительно ростом рынка — модель выбрала более доходную стратегию распределения капитала.
Однако результаты требуют интерпретации:
— Торговля ведётся в учебной среде, где нет реальных рисков ликвидности, проскальзывания или изменения волатильности;
— Ордера исполняются по цене открытия торгового дня, что исключает влияние времени входа и снижает сложность управления рисками;
— Доступ к новостям не всегда временно привязан — некоторые материалы поступают в систему без даты, что теоретически может позволить модели использовать информацию, опережающую временной горизонт торговли;
— Период тестирования — очень короткий, менее месяца;
— Рынок находится в выраженном бычьем тренде, особенно в технологическом секторе: достаточно было увеличить долю Nvidia, Microsoft и ASML, чтобы обогнать индекс.
Это означает, что текущий результат — не полная проверка устойчивости стратегии, а скорее демонстрация способности модели собирать и интерпретировать сигналы, действовать решительно и эффективно перераспределять активы в условиях растущего рынка.
Успех DeepSeek может быть связан с её архитектурой: она обучена на данных, включающих финансовые отчёты, аналитические обзоры и историю фондовых движений, что делает её чувствительной к ключевым триггерам — например, выходу новых чипов, изменению прогнозов доходов или макроэкономическим сигналам.
Пока проект не является надёжным индикатором долгосрочной эффективности. Он показывает, как модели ведут себя в стабильных, предсказуемых условиях, но не проверяет их поведение при падении рынка, шорт-игре, управлении убытками или работе с ограниченной ликвидностью.
Если разработчики AI-Trader доработают методику — переведут торговлю на почасовой цикл, ограничат доступ к новостям по времени, введут комиссии и проскальзывание — это позволит создать более жёсткий бенчмарк. Такой подход будет ближе к реальности и поможет оценить не только доходность, но и зрелость моделей: их способность контролировать риск, адаптироваться к медвежьим трендам и сохранять капитал.
Пока же лидерство DeepSeek — важный сигнал: он демонстрирует, что модели, ориентированные на анализ текста и принятие решений, могут превосходить как пассивные стратегии, так и западные аналоги. Но для настоящего доверия им нужно пройти испытания в условиях, где цена ошибки — не ноль, а реальные убытки.