Компания Moonshot AI анонсировала развитие мультимодальных и агентных возможностей для модели Kimi K2
Разработчик планирует выпуск облегченных версий модели, интеграцию компьютерного зрения и внедрение агентного режима с инструментами для исследовательских и аналитических задач.
Команда Moonshot AI в ходе сессии на Reddit раскрыла дорожную карту развития модели искусственного интеллекта Kimi K2. Планы включают создание специализированных версий различной сложности, внедрение мультимодальных функций и разработку агентного режима с поддержкой инструментов.
В ближайшие месяцы компания выпустит версии модели объемом от 15 до 30 миллиардов параметров, оптимизированные для работы на графических процессорах потребительского уровня, включая RTX 3090, 4090 и 5090. Эти модификации предназначены для локального развертывания и корпоративных экспериментов.
Ведутся работы по интеграции компьютерного зрения в архитектуру K2. Мультимодальная версия сможет анализировать графические материалы, скриншоты, PDF-документы и другие визуальные данные. Разработчики отмечают, что первоначальный выпуск текстовой версии позволил отработать архитектурные решения и процедуры обучения.
Ключевым направлением развития является реализация агентного режима с поддержкой инструментов. Модель будет функционировать по принципу "анализ → применение инструмента → повторный анализ", что позволит автоматизировать процессы исследования данных, программирования и аналитики. Техническая команда сосредоточена на обеспечении стабильности выполнения циклов и минимизации ошибок при взаимодействии с внешними сервисами.
Для ускорения обработки в базовой конфигурации модели используется формат INT4. Архитектура включает гибридный механизм внимания KDA с позиционным кодированием NoPE MLA и оптимизатор Muon, прошедший масштабное тестирование. Разработка следующего поколения модели K3 находится на начальной стадии.