Компания Moonshot AI анонсировала развитие мультимодальных и агентных возможностей для модели Kimi K2

Email: info@smartinfra.ru

Разработчик планирует выпуск облегченных версий модели, интеграцию компьютерного зрения и внедрение агентного режима с инструментами для исследовательских и аналитических задач.

Команда Moonshot AI в ходе сессии на Reddit раскрыла дорожную карту развития модели искусственного интеллекта Kimi K2. Планы включают создание специализированных версий различной сложности, внедрение мультимодальных функций и разработку агентного режима с поддержкой инструментов.

В ближайшие месяцы компания выпустит версии модели объемом от 15 до 30 миллиардов параметров, оптимизированные для работы на графических процессорах потребительского уровня, включая RTX 3090, 4090 и 5090. Эти модификации предназначены для локального развертывания и корпоративных экспериментов.

Ведутся работы по интеграции компьютерного зрения в архитектуру K2. Мультимодальная версия сможет анализировать графические материалы, скриншоты, PDF-документы и другие визуальные данные. Разработчики отмечают, что первоначальный выпуск текстовой версии позволил отработать архитектурные решения и процедуры обучения.

Ключевым направлением развития является реализация агентного режима с поддержкой инструментов. Модель будет функционировать по принципу "анализ → применение инструмента → повторный анализ", что позволит автоматизировать процессы исследования данных, программирования и аналитики. Техническая команда сосредоточена на обеспечении стабильности выполнения циклов и минимизации ошибок при взаимодействии с внешними сервисами.

Для ускорения обработки в базовой конфигурации модели используется формат INT4. Архитектура включает гибридный механизм внимания KDA с позиционным кодированием NoPE MLA и оптимизатор Muon, прошедший масштабное тестирование. Разработка следующего поколения модели K3 находится на начальной стадии.

Контакты:

info@smartinfra.ru
105118, г. Москва,
ул. Буракова, 27 к3,
3 этаж, офис 322