Giga-Embeddings — это модель для преобразования текста в векторные представления, оптимизированная для русского языка. По результатам бенчмарка ruMTEB, она достигла результата 74.1 — на 10–15% выше, чем у других открытых моделей, включая multilingual-e5 и Sentence-BERT. Модель также демонстрирует конкурентоспособные показатели на английском языке, что позволяет применять её в мультиязычных системах. Её ключевое применение — построение RAG-архитектур (Retrieval-Augmented Generation), где точность поиска по документам напрямую влияет на качество ответов генеративных моделей. Корпоративные пользователи могут использовать Giga-Embeddings для создания чат-ботов, систем аналитики, автоматизированного поиска в базах юридических документов, отчётов и внутренних знаний — с минимальным риском галлюцинаций и ошибок, вызванных неточным извлечением данных.
Kandinsky Video Lite — компактная модель генерации видео по текстовому запросу (промпту), способная создавать ролики длительностью до 10 секунд. Модель содержит 2 млрд параметров — в 13–14 раз меньше, чем такие аналоги, как Wan 2.2 A14B или Sora. При этом, по внутренним тестам, она превосходит по общему качеству (включая соответствие промпту, визуальную детализацию и динамику) модели с 5–14 млрд параметров, такие как Wan 2.1 14B и Wan 2.2 5B. Качество достигнуто за счёт специализированного обучающего датасета, включающего более миллиона изображений и видео, отобранных с участием профессиональных художников и дизайнеров. Датасет акцентирован на культурных, архитектурных и исторических элементах, характерных для России — от улиц Москвы и Санкт-Петербурга до традиционных костюмов, транспорта и пейзажей. Это позволяет модели корректно интерпретировать запросы, связанные с российским контекстом, где другие модели часто генерируют искажённые или неадекватные изображения.
Для ускорения обработки доступна версия Kandinsky Video Lite Flash — оптимизированный вариант, работающий в шесть раз быстрее базовой модели, что делает её пригодной для использования в реальном времени, в мобильных приложениях и на устройствах с ограниченными ресурсами.
Обе модели доступны на основных платформах открытого кода — Hugging Face, GitHub и других. Они не требуют лицензирования, не привязаны к облачным сервисам Сбера и могут быть развернуты локально, в частных облаках или на edge-устройствах. Это снижает зависимость от внешних провайдеров, повышает контроль над данными и позволяет интегрировать модели в корпоративные системы без риска утечки информации.
Разработка и публикация моделей — не маркетинговый шаг, а стратегическое решение: они уменьшают барьеры для входа на рынок ИИ-решений, позволяют разработчикам и стартапам создавать продукты без затрат на обучение собственных моделей, а компаниям — внедрять генеративный ИИ в процессы маркетинга, обучения, поддержки и автоматизации без риска нарушения лицензий или зависимости от зарубежных вендоров.
Giga-Embeddings уже используется в RAG-системах внутри Сбера для обработки документов клиентов и внутренних отчётов. Kandinsky Video Lite применяется в рекламных кампаниях для генерации персонализированных видеороликов. Теперь эти решения становятся общедоступными — что формирует основу для роста российской экосистемы ИИ, где технологии не являются закрытыми активами, а служат инфраструктурой для массового развития.