MiniMax представил флагманскую модель M2.5 с фокусом на кодинг и агентные задачи

Email: info@smartinfra.ru

Нейросеть демонстрирует результаты 80,2% в бенчмарке SWE-Bench Verified и 51,3% в Multi-SWE-Bench. Ключевые особенности — архитектурное планирование перед генерацией кода, скорость инференса до 100 токенов в секунду и стоимость на порядок ниже конкурентов.

Компания MiniMax официально выпустила новую флагманскую модель MiniMax-M2.5, ориентированную на решение задач программирования, инструментального взаимодействия (tool use), поиска и офисных сценариев. Обучение модели проводилось с применением reinforcement learning в сотнях тысяч реальных окружений. В ключевых бенчмарках модель показала следующие результаты: SWE-Bench Verified — 80,2%, Multi-SWE-Bench — 51,3%, BrowseComp (с управлением контекстом) — 76,3%.

Отличительной особенностью M2.5 стала способность к предварительному архитектурному планированию. Перед генерацией кода модель декомпозирует требования и формирует структурное описание проекта, что приближает её к работе реального разработчика-архитектора. Обучение проводилось более чем на 10 языках программирования, включая Go, C/C++, Rust, TypeScript, Python и Java, в 200 тысячах сред. На дополнительных тестах Droid и OpenCode в рамках SWE-Bench Verified M2.5 показала результаты 79,7 и 76,1 соответственно, немного опередив Claude Opus 4.6.

В задачах SWE-Bench Verified M2.5 выполняет задания на 37% быстрее предыдущей версии M2.1: среднее время снижено с 31,3 до 22,8 минуты, что сопоставимо с показателем Anthropic Opus 4.6 (22,9 минуты). При этом заявленная стоимость использования составляет около 10% от стоимости Opus. Lightning-версия модели обеспечивает скорость инференса до 100 токенов в секунду.

Попробовать MiniMax M2.5 можно бесплатно в KodaCode для VS Code, JetBrains IDE и Koda CLI. Для этого необходимо установить расширение, выполнить вход в аккаунт и выбрать модель в настройках.

Контакты:

info@smartinfra.ru
105118, г. Москва,
ул. Буракова, 27 к3,
3 этаж, офис 322