Microsoft развертывает в своих дата-центрах ИИ-ускоритель Maia 200 второго поколения

Email: info@smartinfra.ru

Компания начала установку новых чипов, выполненных по 3-нм техпроцессу, в американских дата-центрах. Ускоритель обеспечивает производительность свыше 10 петафлопс в FP4 и на 30% эффективнее по стоимости, чем решения конкурентов.

Microsoft приступила к внедрению в свои дата-центры ИИ-ускорителя Maia 200 собственной разработки, представляющего второе поколение этой линейки. Развёртывание новых чипов нацелено на снижение зависимости от сторонних поставщиков, в первую очередь Nvidia, и оптимизацию совокупной стоимости владения инфраструктурой для задач искусственного интеллекта. Ускорители уже устанавливаются в центрах обработки данных компании в США, а для разработчиков открыт доступ к комплекту средств разработки (SDK). При этом публичная доступность инстансов на базе Maia 200 в сервисе Azure пока не анонсирована.

Чип Maia 200 производится по 5-нм технологическому процессу и насчитывает более 140 миллиардов транзисторов. Его архитектура изначально создавалась для инференса (логического вывода) больших языковых моделей. Заявленная производительность системы превышает 10 петафлопс при работе с форматом данных FP4 и достигает 5 петафлопс в формате FP8, что позиционирует решение для массового промышленного использования ИИ-сервисов.

Конфигурация подсистемы памяти ускорителя включает 216 ГБ памяти HBM3e с пропускной способностью до 7 ТБ/с, а также 272 МБ высокоскоростного SRAM-кэша, расположенного непосредственно на кристалле. Теплопакет одного чипа составляет 750 Вт, что соответствует современным стандартам дата-центрового оборудования высокого класса для задач ИИ.

По результатам внутренних тестов Microsoft, Maia 200 демонстрирует производительность примерно в три раза выше, чем у ускорителя Amazon Trainium 3, и превосходит чип Google TPU v7 в задачах инференса с использованием формата FP8. Архитектура также поддерживает масштабирование в кластерах до 6144 ускорителей без деградации эффективности, что является критически важным для работы с наиболее крупными моделями.

Компания отдельно акцентирует экономический эффект от внедрения. По показателю производительности на доллар затрат Maia 200 примерно на 30% эффективнее текущих решений ключевых конкурентов. Если эти данные подтвердятся в промышленной эксплуатации, Microsoft получит значительное преимущество в себестоимости проведения инференса для собственного портфеля ИИ-сервисов.

Контакты:

info@smartinfra.ru
105118, г. Москва,
ул. Буракова, 27 к3,
3 этаж, офис 322