Войти

Курсы криптовалют
TETHER
USDT
$0.997
+0.05%
CHAINLINK
LINK
$19.12
+0.473%
UNISWAP
UNI
$9.753
+0.464%
AAVE
AAVE
$263.94
+2.832%
DOGECOIN
DOGE
$0.25812
-3.47%
TRON
TRX
$0.2414
-0.74%
RIPPLE
XRP
$2.6296
-3.805%
BITCOIN
BTC
$95469.11
-1.634%
ETHEREUM
ETH
$2732.66
+1.274%
LITECOIN
LTC
$122.02
-3.671%
BITCOIN CASH
BCH
$321.3
-2.725%
ETHEREUM CLASSIC
ETC
$20.93
+1.849%
SHIBA INU
SHIB
$0.00001558
-2.868%
BNB
BNB
$670.2
-1.077%
INTERNET COMPUTER
ICP
$7.01
-0.071%
SOLANA
SOL
$178.17
-6.541%
FILECOIN
FIL
$3.366
-2.094%
BITGET TOKEN
BGB
$5.031
+0.199%
POLKADOT
DOT
$4.86
-1.58%
COSMOS HUB
ATOM
$4.766
-1.386%
AVALANCHE
AVAX
$24.9
-1.033%
CRONOS
CRO
$0.0873
-0.569%
TONCOIN
TON
$3.768
-0.685%
USDC
USDC
$1
+0.02%
CARDANO
ADA
$0.7959
+2.684%
NEAR PROTOCOL
NEAR
$3.287
-6.273%
WRAPPED BITCOIN
WBTC
$95408.8
-1.609%
DAI
DAI
$1.0002
XRP
XRP
$2.6291
-3.819%
ARTIFICIAL SUPERINTELLIGENCE ALLIANCE
FET
$0.767
-2.788%
APTOS
APT
$5.95
+0.847%
ARBITRUM
ARB
$0.489
+1.242%
BITTENSOR
TAO
$356.5
-1.791%
LIDO STAKED ETHER
STETH
$2725.31
+1.176%
PEPE
PEPE
$0.00000993
+0.404%
SUI
SUI
$3.1954
-3.981%
KASPA
KAS
$0.1063
-3.276%
STELLAR
XLM
$0.3342
-2.877%
POL (EX-MATIC)
POL
$0.3205
-2.643%
ONDO
ONDO
$1.2418
-3.751%
ETHENA USDE
USDE
$0.9994
-0.02%
ETHENA
ENA
$0.454
-0.132%
VECHAIN
VET
$0.03289
-1.409%
RENDER
RENDER
$4.372
-3.996%
HEDERA
HBAR
$0.2131
-4.568%
MANTRA
OM
$7.3475
-1.556%
ALGORAND
ALGO
$0.2702
-2.208%
HYPERLIQUID
HYPE
$25.17
-4.911%
WRAPPED EETH
WEETHUSDT
$2905.32
+1.693%
OFFICIAL TRUMP
TRUMP
$17.296
-7.562%

DeepSeek подозревают в использовании моделей OpenAI для обучения своего ИИ

0

Ии аня site 2

Ажиотаж вокруг китайского ИИ не прекращается. Много разговоров в отрасли о реальной эффективности чат-бота и неприлично маленькой стоимости для такого проекта. Некоторые исследователи сомневаются, что в сумму $5,6 млн, которая заявляется как цена технологии DeepSeek, входят затраты на графические процессоры, строительство ЦОД, эксперименты. Компании, связанные с ИИ, пытаются выяснить, как была создана нейросеть и какой у нее потенциал. Meta даже создала специальную команду, сосредоточенную на анализе DeepSeek.

Кроме этого, в СМИ появилась информация, что DeepSeek для сокращения затрат на разработку больших языковых моделей, возможно, использовал данные OpenAI. Об этом заявили Дэвид Сакс, глава политики администрации США в области ИИ и криптовалют, и представители Microsoft.

«Криптоцарь» в интервью Fox News сообщил, что имеются некие «веские доказательства» того, что китайский стартап для создания своей технологии использовал результаты работы моделей OpenAI. Сакс рассказал про процесс дистилляции, когда одна ИИ-модель применяет результаты другой для обучения и развития аналогичных возможностей. Иными словами, дистилляция в сфере ИИ – это перенос данных из большой модели в меньшую. Представители OpenAI ничего прямо не предъявили DeepSeek, но подчеркнули, что они принимают все меры для защиты своей интеллектуальной собственности, чтобы не дать конкурентам завладеть передовыми американскими технологиями.

А специалисты по безопасности Microsoft, согласно Bloomberg, заметили, что люди, предположительно связанные с DeepSeek, извлекали осенью большое количество данных с помощью интерфейса прикладного программирования (API) OpenAI. По информации СМИ, Microsoft как крупнейший инвестор OpenAI взялась расследовать, украл ли китайский ИИ данные у разработчика ChatGPT. Исследователь ИИ Майлз Брандейдж (Miles Brundage), который работал в OpenAI, отметил, что, даже если дистилляция данных была проведена и она сэкономила китайскому стартапу немного времени и денег, они проделали много стоящей технической работы.

Стоит отметить, что в среду глава Microsoft Сатья Наделла (Satya Nadella) сказал несколько лестных слов о DeepSeek. Он заявил, что стартап ввел несколько реальных инноваций, и теперь они получат широкое применение.

А откуда взялась компания DeepSeek?

Основатель проекта – 40-летний предприниматель Лян Вэньфэн (Liang Wenfeng). У него есть степени бакалавра и магистра по информационной и коммуникационной инженерии. Ваньфэна всегда интересовал ИИ, но в начале пути единомышленников у него почти не было. В 2008 году он пробовал использовать машинное обучение для трейдинга, в 2015-м – основал хедж-фонд High-Flyer, где применял ИИ для торговли на рынках. В 2019 году фонд создал ИИ-компанию High-Flyer и инвестировал $28 млн в разработку модели Yinghuo, для которой приобрели 1100 чипов Nvidia. Через 2 года компания вложила уже $139 млн в Yinghuo 2 и купила для нее 10 000 видеокарт Nvidia A100. В 2023-м Лян решил создать проект, который не был бы связан с трейдингом. Так появился DeepSeek, выпустивший в мае прошлого года сначала нейросеть DeepSeek-V2, потом осенью – DeepSeek-V3, и уже в январе 2025 года мир увидел DeepSeek-R1. Кстати, Вэньфэн не гонится за какими-то редкими кадрами, а больше ценит увлеченность работой. Большинство его сотрудников – начинающие специалисты.

Команда, создавшая последнюю версию DeepSeek, придумала несколько простых, но ключевых инноваций. Например, смогла извлечь больше пользы от старых чипов. Еще одно достижение – использование способа обучения с подкреплением (reinforcement learning), когда за правильные ответы систему поощряют, а за неверные – наказывают. Чат-бот взорвал все топы по популярности, потому что, во-первых, те возможности, которые OpenAI предлагает за $200, DeepSeek предоставляет бесплатно, а, во-вторых, он более детально прорабатывает запросы пользователей.

Screenshot 20250130 205941 comandroidchrome edit 259874946939512jpg

Гендиректор компании OpenReplay Мехди Осман (Mehdi Osman) отметил, что они всегда пользовались услугами OpenAI, Anthropic и Mistral, но с появлением DeepSeek, который не отстает от этих решений, он раздумывает о смене поставщиков. «Если OpenAI не снизит цены, я думаю, многие разработчики перейдут на DeepSeek в ближайшие месяцы», — считает Осман.

Тем временем появились слухи, что администрация Трампа планирует ввести дополнительные ограничения на продажу чипов Nvidia Китаю. Компания с 2022 года может поставлять в КНР только определенные видеокарты – с меньшей мощностью, но на китайский рынок полупроводников это не особо влияет. Даже если эта информация не подтвердится, абсолютно точно США будут делать все возможное, чтобы показать Китаю, кто главный. И здесь напрашивается вопрос «А в чем сила?». Глава стартапа Cohere Эйдан Гомес (Aidan Gomez), например, считает, что языковые модели будут принадлежать тем, кто сосредоточится на более эффективных методах, а не на увеличении количества вычислений.

Скриншот: данные сайта openlm.ai