Microsoft представила новый ИИ-чип под названием Maia 200, который призван значительно повысить экономическую эффективность генерации токенов. Компания заявляет, что это мощная вычислительная платформа, способная справляться с самыми масштабными современными нагрузками и обладающая запасом производительности для будущих моделей ИИ.
Maia 200 производится по 3-нм техпроцессу TSMC и насчитывает более 140 миллиардов транзисторов. Архитектура чипа включает:
- Тензорные ядра с поддержкой форматов FP8 и FP4.
- Переработанную подсистему памяти. 216 ГБ HBM3e с пропускной способностью 7 ТБ/с.
- 272 МБ встроенной памяти SRAM.
- Специализированные механизмы перемещения данных для быстрой и эффективной работы больших моделей.
Новый ИИ-чип специально разработан для современных ИИ-моделей, использующих вычисления низкой точности. При теплопакете (TDP) в 750 Вт он демонстрирует впечатляющие показатели:
-
Более 10 петафлопс в режиме FP4.
-
Более 5 петафлопс в режиме FP8.
Maia 200 станет частью гетерогенной ИИ-инфраструктуры Microsoft. Компания уже подтвердила, что он будет использоваться для таких моделей, как GPT-5.2 от OpenAI. Ожидается, что переход на новый чип обеспечит лучшее соотношение цены и производительности для сервисов Microsoft Foundry и Microsoft 365 Copilot.