В конце августа 2025 года корпорация Microsoft совершила знаковый шаг, представив свои первые собственные модели искусственного интеллекта — MAI-1 Voice и MAI-1 Preview. Этот анонс знаменует важный поворотный момент в стратегии компании, которая до сих пор в значительной степени полагалась на технологии OpenAI для развития своих ИИ-продуктов. За направление разработки собственных ИИ-решений в Microsoft отвечает Мустафа Сулейман — один из сооснователей DeepMind, который сегодня возглавляет подразделение Microsoft AI. Появление этих моделей свидетельствует о стремлении технологического гиганта снизить зависимость от внешних партнеров и создать полноценную экосистему собственных ИИ-решений.
MAI-1 Voice: революция в генерации речи

Китайская революция ИИ: Qwen2.5-Max и DeepSeek V3
Модель MAI-1 Voice представляет собой передовую систему генерации естественной речи, способную создавать высококачественное аудио с впечатляющей скоростью. По заявлениям Microsoft, модель может сгенерировать целую минуту аудио менее чем за секунду, используя при этом всего один графический процессор.
Ключевые особенности MAI-1 Voice:
— Высокая выразительность: модель создает эмоционально окрашенную речь с различными стилями и интонациями;
— Многоговорящий режим: поддержка генерации диалогов между несколькими собеседниками;
— Быстродействие: минута аудио за секунду на одном GPU;
— Естественность: речь звучит максимально приближенно к человеческой.
Пользователи уже могут оценить возможности MAI-1 Voice в действии. В Copilot Labs доступна функция, где можно ввести любой текст, выбрать стиль речи (например, «радостный» или «эмоциональный») и получить высококачественное аудио с соответствующими интонациями.
Архитектура и обучение
MAI-1 Preview представляет собой первую собственную фундаментальную языковую модель Microsoft, основанную на архитектуре MoE (Mixture of Experts) — смешанной модели экспертов. Модель прошла комплексное обучение на 15000 графических процессорах NVIDIA H100 на платформе LMArena — популярном бенчмарке для оценки ИИ-моделей сообществом. Это позволяет получить объективную оценку производительности модели в сравнении с конкурентами. Microsoft также предоставляет ранний API-доступ к MAI-1 Preview для доверенных тестировщиков и разработчиков.
Позиционирование и стратегия развития
Microsoft подчеркивает, что новые модели не заменяют технологии OpenAI в продуктах Copilot, а дополняют их. Компания планирует использовать лучшие решения как собственной команды, так и партнеров, включая сообщество разработчиков открытого ПО. Как отметил Мустафа Сулейман, внутренние модели ИИ Microsoft ориентированы на обычных пользователей, а не на корпоративный сектор. Это позволяет компании диверсифицировать свое портфолио и снизить риски, связанные с зависимостью от единственного поставщика технологий.
Влияние на рынок ИИ-технологий
Выход Microsoft на рынок с собственными ИИ-моделями значительно усиливает конкуренцию в отрасли. Теперь технологический гигант сможет более эффективно конкурировать с такими игроками, как OpenAI, Google, Anthropic и другими разработчиками ИИ-систем. Это особенно важно в контексте стратегического отхода от OpenAI и наращивания самостоятельной компетенции.
MAI-1 Voice уже показывает впечатляющие результаты в генерации естественной речи, а MAI-1 Preview закладывает основу для будущих языковых моделей компании. Эти разработки не только укрепляют технологические позиции Microsoft, но и создают предпосылки для более интенсивной конкуренции на рынке ИИ-решений.
В долгосрочной перспективе стратегическая независимость Microsoft в области ИИ может способствовать более быстрому развитию отрасли в целом, обеспечивая пользователям больше выбора качественных решений по конкурентоспособным ценам.