DeepSeek выпустила улучшенную версию ИИ-модели R1 с 685 млрд параметров

29 май 2025, 11:27

Китайский ИИ-стартап DeepSeek сделал неожиданный шаг, выпустив обновлённую версию своей флагманской модели рассуждений R1 под открытой лицензией MIT. В отличие от обычных корпоративных анонсов, компания не стала публиковать подробные технические отчёты или маркетинговые материалы, выложив на платформу Hugging Face лишь «сырые» конфигурационные файлы и весовые коэффициенты. Этот ход, с одной стороны, демонстрирует приверженность принципам открытого исходного кода, а с другой — ставит перед сообществом и бизнесом серьёзный вопрос: насколько реально использовать такую массивную модель вне дата-центров?

Новая версия R1: 685 миллиардов параметров и полная прозрачность

Обновлённая модель DeepSeek R1 содержит 685 миллиардов параметров — это колоссальный объём, который ставит её в один ряд с самыми тяжёлыми нейросетями в мире. Как отмечают аналитики, без дополнительной оптимизации и специализированного оборудования запустить такую систему на обычных пользовательских компьютерах или даже серверах среднего класса практически невозможно. По сути, DeepSeek предоставила сообществу «двигатель», который требует мощного «шасси» для работы.

Почему открытая лицензия MIT — это не просто жест доброй воли

Выбор лицензии MIT, которая позволяет свободно использовать, модифицировать и встраивать код в коммерческие продукты, — это стратегический манёвр. В то время как американские регуляторы выражают обеспокоенность по поводу потенциальной угрозы национальной безопасности, исходящей от китайских ИИ-технологий, DeepSeek демонстрирует максимальную открытость. Компания фактически снимает с себя ответственность за возможные риски, передавая инструмент в руки глобального сообщества разработчиков. Теперь любой стартап или корпорация может провести собственный аудит безопасности модели, но для этого потребуется доступ к вычислительным мощностям, сопоставимым с ресурсами крупных облачных провайдеров.

В репозитории Hugging Face пока отсутствует подробное описание модели или инструкции по развёртыванию. Это создаёт определённый барьер для входа: даже опытные инженеры столкнутся с необходимостью самостоятельно разбираться в архитектуре и искать способы снижения требований к ресурсам без потери производительности.

Релиз первой версии R1 в начале года вызвал настоящий ажиотаж, поскольку модель продемонстрировала результаты, сопоставимые с разработками OpenAI, при значительно меньших затратах на обучение. Тогда успех стартапа привёл к временной блокировке его сервисов в Южной Корее и пристальному вниманию со стороны американских спецслужб. Однако, несмотря на давление, DeepSeek не только не свернула проект, но и пошла по пути максимальной открытости, что является сильным контрастом с политикой закрытости многих западных вендоров.

Этот шаг может кардинально изменить расклад сил на рынке ИИ. С одной стороны, открытая модель с 685 миллиардами параметров даёт стартапам и исследовательским группам доступ к технологиям, которые ранее были прерогативой гигантов вроде Google или Meta. С другой — высокая ресурсоёмкость R1 создаёт новый рынок для облачных провайдеров, которые смогут предлагать специализированные тарифы для работы с этой нейросетью. Если DeepSeek или сторонние разработчики найдут способ эффективно сжимать модель без потери качества, мы можем стать свидетелями новой волны демократизации ИИ, где границы между «закрытыми» и «открытыми» системами окончательно сотрутся.

Опубликовано: Мировое обозрение Источник