DeepSeek, китайский стартап в области искусственного интеллекта, представил две передовые языковые модели, которые по своим возможностям не уступают OpenAI’s GPT-5 и Google’s Gemini 3.0 Pro, при этом, что принципиально важно, они доступны бесплатно. Это развитие кардинально меняет конкурентную среду в области искусственного интеллекта, доказывая, что высокая производительность не требует проприетарного контроля или непомерных затрат на API.
Прорыв: DeepSeek-V3.2 и DeepSeek-V3.2-Speciale
Компания выпустила две модели: DeepSeek-V3.2, предназначенную для общих задач рассуждения, и DeepSeek-V3.2-Speciale, высокопроизводительную версию, превзошедшую ожидания в нескольких элитных соревнованиях. Это включает в себя достижение золотых медалей на Международной математической олимпиаде 2025 года, Международной олимпиаде по информатике, финале ICPC и Китайской математической олимпиаде.
Вывод очевиден: Китай стремительно сокращает разрыв в лидерстве в области ИИ, несмотря на экспортный контроль США, ограничивающий доступ к передовым аппаратным средствам, таким как чипы Nvidia. Модели DeepSeek демонстрируют, что инновации не зависят исключительно от ограниченного доступа к технологиям.
Эффективность благодаря Sparse Attention
Прорыв DeepSeek заключается в архитектуре «Sparse Attention» (DSA). Этот инновационный подход решает ключевое ограничение традиционных моделей ИИ: экспоненциальный рост вычислительных затрат при увеличении длины входных данных. DSA избирательно фокусируется на наиболее релевантных частях документа, игнорируя несущественные данные, вдвое снижая затраты на вывод, по сравнению с предыдущими моделями при обработке длинных последовательностей.
Это означает, что анализ 300-страничной книги теперь стоит около 0,70 долларов, по сравнению с 2,40 долларами для старой модели V3.1. 685-миллиардные модели поддерживают контекстное окно в 128 000 токенов, что делает их пригодными для сложных задач, таких как анализ кодовых баз и научных работ.
Бенчмарки: Соответствие – и иногда превосходство – над американскими лидерами
Модели DeepSeek не просто заявляют о соответствии; они демонстрируют это посредством строгих испытаний. На математическом соревновании AIME 2025 года вариант Speciale достиг 96,0% прохождения, превзойдя GPT-5-High (94,6%) и Gemini 3.0 Pro (95,0%). На математическом турнире Гарварда-MIT модель Speciale набрала 99,2%, снова превзойдя Gemini’s 97,5%.
Результаты распространяются и на кодирование: DeepSeek-V3.2 решает 73,1% реальных программных ошибок на SWE-Verified, что сопоставимо с GPT-5-High (74,9%). На Terminal Bench 2.0, измеряющем сложные рабочие процессы кодирования, DeepSeek набрал 46,4%, что значительно выше 35,2% у GPT-5-High.
Эти результаты особенно примечательны, учитывая, что тестирование проводилось без доступа к интернету или внешним инструментам, в соответствии со строгими ограничениями соревнований.
Мышление в использовании инструментов: Новый уровень рассуждений
DeepSeek-V3.2 вводит решающую возможность: «мышление в использовании инструментов». В отличие от предыдущих моделей, он поддерживает контекст рассуждений между несколькими вызовами инструментов (выполнение кода, веб-поиск, манипулирование файлами). Это позволяет решать сложные многоступенчатые проблемы, не теряя нить мысли.
Компания обучила это, генерируя огромный синтетический набор данных с более чем 1800 задачами и 85 000 инструкциями, включая инструменты реального мира, такие как веб-API поиска и среды кодирования. В результате получается модель, которая обобщает новые инструменты, что делает ее пригодной для применения в реальных приложениях.
Стратегия с открытым исходным кодом: Подрыв бизнес-модели премиум-класса
Самым разрушительным шагом DeepSeek является выпуск V3.2 и V3.2-Speciale под разрешительной лицензией MIT. Это означает, что любой может загружать, изменять и развертывать эти модели без ограничений. Компания даже предоставляет сценарии Python для бесшовной миграции из API OpenAI.
Эта стратегия бросает вызов доминирующей бизнес-модели закрытого ИИ, где компании, такие как OpenAI, взимают плату за премиальный доступ. Подход DeepSeek с открытым исходным кодом ускоряет инновации и снижает барьеры для входа, потенциально демократизируя возможности ИИ.
Регуляторные ограничения и проблемы экспортного контроля
DeepSeek сталкивается с растущим сопротивлением в Европе и Соединенных Штатах. Немецкие регуляторы признали передачу данных в Китай незаконной, а законодатели США добиваются запрета на использование сервиса на правительственных устройствах.
Несмотря на экспортный контроль, DeepSeek продолжает продвигаться вперед, намекая на альтернативные отечественные чипы (Huawei, Cambricon), которые обходят ограничения. Компания, по сообщениям, обучила свою первоначальную модель V3 на ограниченных чипах Nvidia H800, что указывает на то, что аппаратные ограничения сами по себе не могут остановить прогресс.
Будущее конкуренции в области ИИ: Эффективность против проприетарного контроля
Выпуск DeepSeek знаменует поворотный момент. Компания демонстрирует, что передовой ИИ может быть достигнут благодаря инновациям в области эффективности, а не только за счет огромных капиталовложений. Хотя проприетарные модели по-прежнему имеют преимущества в мировых знаниях, подход DeepSeek с открытым исходным кодом заставляет конкурентов пересматривать свою стратегию.
Гонка в области ИИ между Соединенными Штатами и Китаем вошла в новую фазу. Вопрос теперь в том, смогут ли американские компании сохранить свое лидерство, когда их китайские конкуренты предлагают сопоставимые технологии бесплатно.
