Ажиотаж вокруг китайского ИИ не прекращается. Много разговоров в отрасли о реальной эффективности чат-бота и неприлично маленькой стоимости для такого проекта. Некоторые исследователи сомневаются, что в сумму $5,6 млн, которая заявляется как цена технологии DeepSeek, входят затраты на графические процессоры, строительство ЦОД, эксперименты. Компании, связанные с ИИ, пытаются выяснить, как была создана нейросеть и какой у нее потенциал. Meta даже создала специальную команду, сосредоточенную на анализе DeepSeek.
Кроме этого, в СМИ появилась информация, что DeepSeek для сокращения затрат на разработку больших языковых моделей, возможно, использовал данные OpenAI. Об этом заявили Дэвид Сакс, глава политики администрации США в области ИИ и криптовалют, и представители Microsoft.
«Криптоцарь» в интервью Fox News сообщил, что имеются некие «веские доказательства» того, что китайский стартап для создания своей технологии использовал результаты работы моделей OpenAI. Сакс рассказал про процесс дистилляции, когда одна ИИ-модель применяет результаты другой для обучения и развития аналогичных возможностей. Иными словами, дистилляция в сфере ИИ – это перенос данных из большой модели в меньшую. Представители OpenAI ничего прямо не предъявили DeepSeek, но подчеркнули, что они принимают все меры для защиты своей интеллектуальной собственности, чтобы не дать конкурентам завладеть передовыми американскими технологиями.
А специалисты по безопасности Microsoft, согласно Bloomberg, заметили, что люди, предположительно связанные с DeepSeek, извлекали осенью большое количество данных с помощью интерфейса прикладного программирования (API) OpenAI. По информации СМИ, Microsoft как крупнейший инвестор OpenAI взялась расследовать, украл ли китайский ИИ данные у разработчика ChatGPT. Исследователь ИИ Майлз Брандейдж (Miles Brundage), который работал в OpenAI, отметил, что, даже если дистилляция данных была проведена и она сэкономила китайскому стартапу немного времени и денег, они проделали много стоящей технической работы.
Стоит отметить, что в среду глава Microsoft Сатья Наделла (Satya Nadella) сказал несколько лестных слов о DeepSeek. Он заявил, что стартап ввел несколько реальных инноваций, и теперь они получат широкое применение.
А откуда взялась компания DeepSeek?
Основатель проекта – 40-летний предприниматель Лян Вэньфэн (Liang Wenfeng). У него есть степени бакалавра и магистра по информационной и коммуникационной инженерии. Ваньфэна всегда интересовал ИИ, но в начале пути единомышленников у него почти не было. В 2008 году он пробовал использовать машинное обучение для трейдинга, в 2015-м – основал хедж-фонд High-Flyer, где применял ИИ для торговли на рынках. В 2019 году фонд создал ИИ-компанию High-Flyer и инвестировал $28 млн в разработку модели Yinghuo, для которой приобрели 1100 чипов Nvidia. Через 2 года компания вложила уже $139 млн в Yinghuo 2 и купила для нее 10 000 видеокарт Nvidia A100. В 2023-м Лян решил создать проект, который не был бы связан с трейдингом. Так появился DeepSeek, выпустивший в мае прошлого года сначала нейросеть DeepSeek-V2, потом осенью – DeepSeek-V3, и уже в январе 2025 года мир увидел DeepSeek-R1. Кстати, Вэньфэн не гонится за какими-то редкими кадрами, а больше ценит увлеченность работой. Большинство его сотрудников – начинающие специалисты.
Команда, создавшая последнюю версию DeepSeek, придумала несколько простых, но ключевых инноваций. Например, смогла извлечь больше пользы от старых чипов. Еще одно достижение – использование способа обучения с подкреплением (reinforcement learning), когда за правильные ответы систему поощряют, а за неверные – наказывают. Чат-бот взорвал все топы по популярности, потому что, во-первых, те возможности, которые OpenAI предлагает за $200, DeepSeek предоставляет бесплатно, а, во-вторых, он более детально прорабатывает запросы пользователей.

Гендиректор компании OpenReplay Мехди Осман (Mehdi Osman) отметил, что они всегда пользовались услугами OpenAI, Anthropic и Mistral, но с появлением DeepSeek, который не отстает от этих решений, он раздумывает о смене поставщиков. «Если OpenAI не снизит цены, я думаю, многие разработчики перейдут на DeepSeek в ближайшие месяцы», — считает Осман.
Тем временем появились слухи, что администрация Трампа планирует ввести дополнительные ограничения на продажу чипов Nvidia Китаю. Компания с 2022 года может поставлять в КНР только определенные видеокарты – с меньшей мощностью, но на китайский рынок полупроводников это не особо влияет. Даже если эта информация не подтвердится, абсолютно точно США будут делать все возможное, чтобы показать Китаю, кто главный. И здесь напрашивается вопрос «А в чем сила?». Глава стартапа Cohere Эйдан Гомес (Aidan Gomez), например, считает, что языковые модели будут принадлежать тем, кто сосредоточится на более эффективных методах, а не на увеличении количества вычислений.
Скриншот: данные сайта openlm.ai