Сможет ли Китай с помощью нейросети DeepSeek перехватить лидерство в сфере ИИ

Капитализация ведущих ИТ-компаний США резко просела после выхода на рынок более эффективного конкурента
Zuma / TASS
Zuma / TASS

Акции Nvidia, ведущей американской компании по разработке процессоров и ИИ-чипов, только за 27 января 2025 г. упали на 18%. Ее капитализация сократилась более чем на $600 млрд впервые за историю компании, следует из статистики MarketWatch. Это произошло на фоне новостей о том, что китайская нейросеть от компании DeepSeek обогнала ChatGPT от OpenAI в американском App Store и заняла первое место по скачиваниям среди приложений магазина.

Появление конкурента OpenAI в целом стало «черным лебедем» для американского фондового рынка. Индекс Nasdaq, объединяющий акции ведущих технологических компаний США, по итогам торгов 27 января упал на 3,07% до 19 341,83 пункта. Индекс S&P, который включает 500 самых крупных публичных компаний США, потерял 1,46%, упав до 6012,28 п., а индустриальный индекс Dow Jones вырос на 0,65% до 44 713,58 п.

Больше всех пострадали производители микрочипов. Акции Broadcom потеряли 17,4%, Micron – 11,7%. Marvell Technology – 19,1%. Расписки крупнейшего в мире производителя оборудования для передовых микрочипов – нидерландской ASML – на Nasdaq подешевели на 5,8%. Котировки разработчика инфраструктуры для ИИ Nebius Group (сформирована на базе зарубежных активов бывшей Yandex N.V. Аркадия Воложа) просели сразу на 37%. Но параллельно падали бумаги и других ИТ-компаний США, следует из статистики MarketWatch. Акции Microsoft упали на 3,71%, Google – на 2,76%.

Главный бенчмарк российского фондового рынка индекс Мосбиржи 27 января снизился на 1,9% до 2891,39 п. По состоянию на 13:39 мск 28 января он терял еще 0,23%, опускаясь до 2884,69 п.

Причиной падения акций Nvidia, сообщала американская Financial Times (FT), является то, что DeepSeek использует гораздо меньше чипов для обучения языковой модели, нежели американские конкуренты. Большая часть китайской экономии пришлась на замещение чипов Nvidia, поскольку политика США запрещает поставку высокотехнологичных новейших чипов КНР («Ведомости» подробно писали об этом запрете в декабре 2024 г.) FT сообщает, что это может серьезно подорвать технологическое лидерство США, поскольку многомиллиардные инвестиции в западное оборудование в таком случае теряют смысл.

Но в США дешевели только акции компаний, связанных с ИИ, остальной рынок был в плюсе (6 из 11 секторов рынка росли), написал в своем Telegram-канале финансовый аналитик Павел Рябов. По его расчетам, в понедельник 27 января совокупная капитализация всех публичных американских компаний упала на $953 млрд.

Американский рынок считает, что ИИ «взобрался на пик хайпа» и теперь акции связанных с ним компаний ждет обвал, говорит аналитик брокера «Финам» Леонид Делицын. Многие инвесторы покупали бумаги IT-компаний на короткий срок, надеясь продать раньше, чем начнется снижение, и теперь спешат продать бумаги до прихода других негативных новостей, отметил эксперт. Скоро акции «бигтехов» немного скорректируются, прогнозирует Делицын: акции Nvidia уже подорожали на 4% между торговыми сессиями. После этого, по его мнению, котировки «замрут» на текущих отметках в ожидании отчетностей за 2024 г.

Чем китайский ИИ круче американского

DeepSeek анонсировала новую модель искусственного интеллекта (ИИ) DeepSeek-R1 еще 20 января 2024 г. На фоне растущей популярности этой модели зарубежные СМИ выражали беспокойство, говоря о возможном подрыве технологического лидерства США и ссылаясь на падение акций американских технологических гигантов. 

«Выпуск ИИ DeepSeek должен “разбудить” наши отрасли и заставить сосредоточиться на выигрышной стратегии», – прокомментировал ситуацию президент США Дональд Трамп, сообщает NBC news. Он отметил, что если технологии позволяют настолько удешевить процесс производства, нужно и американским компаниям искать такое решение. Основатель и гендиректор OpenAI Сэм Альтман назвал нового конкурента «воодушевляющим» и обещал выйти на рынок с новыми решениями. Сама Nvidia признала китайскую модель «превосходным достижением в ИИ», не нарушающим политику США, пишет Bloomberg со ссылкой на официальное заявление компании.

Из официальных заявлений DeepSeek следует, что на проект новой модели нейросети было потрачено в общей сложности всего $5,5 млн. Заместитель директора по трансферу технологий Центра компетенций НТИ по направлению «Технологии хранения и анализа больших данных» на базе МГУ Тимофей Воронин уточняет, что это в несколько десятков раз меньше, чем суммы, которые тратят крупнейшие компании США, включая Microsoft и Google, на обучение схожих моделей.

Вторым преимуществом нового ИИ Воронин считает демонстрацию процесса принятия решений от DeepSeek, тогда как ChatGPT, как правило, генерирует только готовый ответ. Эффективность и популярность модели связана и с тем, что текстовые файлы, которые позволяет загружать сам ИИ, достигают 100 МБ, что значительно превышает другие бесплатные опции на рынке.

Модель DeepSeek доступна в открытых кодах и наследует архитектуру уже привычной сообществу американской ИИ-модели Llama от Meta AI (Meta признана экстремистской и запрещена в РФ), отмечает научный руководитель исследовательского центра «Сильный искусственный интеллект в промышленности», эксперт Центра компетенций НТИ «Технологии машинного обучения и когнитивные технологии» на базе ИТМО Александр Бухановский. Он говорит, что хоть этот метод и является традиционным, DeepSeek обладает и определенными преимуществами, связанными с деталями организации процесса обучения.

В первую очередь, по мнению эксперта, речь идет о сбалансированной компоновке обучающих данных, чтобы полноценно покрывать ряд выбранных тестов. Во-вторых, модель применяет целый ряд правил, благодаря которым данные для обучения проходят «вторичную» обработку, удаляя дубликаты и «мусор». Третьей особенностью Бухановский назвал более эффективное использование памяти вычислителей на видеокартах. Как следствие, скорость обучения выше, фактический объем данных меньше, а общая производительность – эффективнее, резюмировал эксперт.

ИИ от DeepSeek имеет большее контекстное окно (окно запроса), нежели его конкуренты, отмечает эксперт Альянса в сфере искусственного интеллекта, автор Telegram-канала «Дизайн образования» Андрей Комиссаров. У стандартных языковых моделей оно может включать в себя до 8000–10 000 символов. В бесплатной версии модели DeepSeek окно в три раза больше, чем у конкурентов, а в платной количество знаков достигает 1 млн. Это, как утверждает Комиссаров, и значительно удешевляет модель, и делает ее эффективнее в решении запросов. «Безусловно, это демпинг рынка, который ломает бизнес основным игрокам», – заявил эксперт.

Эксперт также выделил возможность DeepSeek общаться PDF-файлами. Комиссаров считает, что это значительное рыночное преимущество, так как большинство сервисов за эту функцию требуют дополнительную плату. «А еще он меньше галлюцинирует», – подчеркивает эксперт. Галлюцинациями ИИ называют ситуации, когда вместо указания на ошибочно поставленный вопрос модель начинает «придумывать» ответ, которого нет в действительности.

Директор департамента расследований T.Hunter Игорь Бедеров считает, что глобальные преимущества модели DeepSeek раскрываются и на российском рынке. Китайские разработчики не ограничивают запросы с российских IP-адресов, а сама модель способна понимать запросы на русском языке, эффективно справляясь с ними. Еще одним плюсом, считает Бедеров, является процесс самообучения новой модели и свободный выход в интернет. Эксперт утверждает, что по многим бенчмаркам новая нейросеть либо превосходит, либо не уступает ChatGPT-4o от Open AI.

Будет ли ИИ-революция из-за DeepSeek

Эксперты не приходят к единому мнению, станет ли DeepSeek новым «гигантом» ИТ-технологий. Например, Бедеров считает, что DeepSeek пока сложно оценить на предмет «революционности», это будет понятно из применения модели в реальной экономике. С этим согласен и эксперт рынка TechNet НТИ Антон Аверьянов. Любые языковые модели, считает эксперт, тяжело поддаются коммерциализации и новому ИИ еще придется доказать свое прикладное значение, но в случае успеха это будет революционным решением.

Александр Родин, ведущий эксперт Центра компетенций Национальной технологической инициативы (НТИ) «Искусственный интеллект» на базе МФТИ полагает, что DeepSeek – не полноценная замена ChatGPT, а, скорее, попытка «китайских товарищей отбиться от американского доминирования в сфере ИИ». Бухановский убежден, что если DeepSeek-R1 и не станет революционной, то точно породит отраслевые фундаментальные модели. Воронин резюмирует, что DeepSeek сможет лишь частично полноценно заменить ChatGPT – в решении простых задач для работы с источниками и поиска информации. Появление модели от DeepSeek он называет одним из естественных этапов [технологической] гонки Китая и США, а также демонстрацией поиска возможностей в условиях торговых ограничений.

Трамп уже утверждал, что с Китаем идет серьезное соперничество в сфере ИИ, писали «Ведомости» в январе 2025 г. Компании OpenAI, Oracle и SoftBank в качестве поддержки технологического рынка США создадут совместный проект Stargate, который должен обеспечить прорыв в инфраструктуре ИИ в следующие четыре года. На проект компании выделяют инвестиции в размере $500 млрд, без учета уже обещанных вложений от главного исполнительного директора SoftBank Group Масаёси Сона в размере $100 млрд.

Можем ли повторить

Для России, считает Родин, единственный шанс занять существенную позицию в гонке ИИ – придумать что-то, до чего еще не догадались конкуренты. При этом эксперт полагает, что это не языковые модели. Бухановский говорит, что России, наоборот, следует разрабатывать не новое, а двигаться «асимметрично», используя открытый код и создавая модели для специализированных задач.

Сейчас в России, рассуждает Воронин, уже есть конкурентные языковые модели, например GigaChat от «Сбера», YandexGPT от «Яндекса» и JustGPT от Just AI. Все они, считает эксперт, балансируют между собой в скорости, креативности и оригинальности ответов. Но для полноценной конкурентоспособности России, в первую очередь, следует наращивать инфраструктуру, включая строительство дата-центров, и увеличивать объемы частных инвестиций в развитие ИИ, резюмировал Воронин. Бедеров с этим соглашается: модели «Сбера» и «Яндекса» представляют собой прекрасный и перспективный проект.

DeepSeek по своим характеристикам обходит все российские языковые модели, кроме моделей от Т-банка, но и они были основаны на китайской модели Qwen-2.5 от Alibaba Group, заключил Комиссаров.