Вышла DeepSeek 3.1 с улучшенной памятью и поддержкой более крупных запросов

19 авг 2025, 23:25

Почему DeepSeek V3.1 — это не просто апдейт, а смена парадигмы контекста

Китайский стартап DeepSeek снова в деле. На этот раз — обновление модели V3. Версия 3.1 уже доступна для тестирования. Главная фишка — увеличенное контекстное окно. Звучит как обычный апдейт? Не совсем. Это меняет то, как мы работаем с нейросетями. И вот почему.

Контекстное окно — это объём информации, который модель «помнит» во время диалога. Чем оно больше, тем длиннее может быть беседа без потери нити. У предыдущей V3 было 128 000 токенов — примерно 200 страниц текста. Этого хватало для большинства задач. Но для анализа книг, код-баз или длинных переписок — уже впритык. V3.1, по неофициальным данным, расширяет окно до 1 миллиона токенов. Это около 1500 страниц. Цифра, которая раньше была доступна лишь Gemini от Google.

Увеличение контекстного окна в 10 раз меняет саму архитектуру взаимодействия: вместо 'вопрос-ответ' мы получаем 'аналитическую беседу'.

Что даёт большой контекст на практике

Допустим, вы юрист. Загружаете договор на 500 страниц и задаёте вопросы по любому пункту — модель помнит всё. Или вы разработчик: кидаете в чат весь репозиторий, а потом спрашиваете про архитектуру. Никакой потери контекста. Раньше приходилось разбивать документ на куски, теряя связи между частями. Больше нет. Это не эволюция — это скачок.

Сравнение V3 и V3.1 (по имеющимся данным)

Параметр	DeepSeek V3	DeepSeek V3.1 (оценка)
Контекстное окно	128K токенов	~1M токенов
Максимальная длина диалога	~200 страниц	~1500 страниц
Время ответа (типичный запрос)	~1.5 с	~2 с (возможно, чуть медленнее)
Доступность	API, чат	Тестирование, скоро API

Цифры по V3.1 — неофициальные. Компания не раскрыла точных характеристик. Но даже такой апгрейд ставит DeepSeek в один ряд с лидерами индустрии — при том что затраты на обучение у них были в разы ниже, чем у OpenAI.

Недавно я тестировал DeepSeek R1 на задаче анализа юридических документов. После 50 страниц модель начинала путать факты. V3.1 с увеличенным контекстом может решить эту проблему. Жду возможности проверить лично. Но уже сейчас видно: ставка на память — правильный ход.

Как использовать длинный контекст DeepSeek V3.1: три простых сценария

Анализ договоров и контрактов — загрузите до 1500 страниц, задавайте вопросы по каждому разделу. Модель найдёт противоречия, которые вы упустили.
Поддержка клиентов с полной историей — чат-бот помнит все обращения за месяц. Никаких повторных объяснений.
Работа с исходным кодом — киньте в окно весь проект (до 1 млн строк кода) и спрашивайте про баги, зависимости или архитектуру.

Моё мнение: сейчас многие LLM хороши в рассуждениях, но их память — узкое место. DeepSeek делает ставку на то, что нужно бизнесу: работа с большими объёмами данных в одном сеансе. Да, возможно, скорость инференса чуть упадёт — но это плата за глубину. И она оправдана.

Параллельно в Китае говорят о задержке модели R2. Причина — перфекционизм CEO Лян Вэньфэна и проблемы с поставками чипов Nvidia. Пока рынок ждёт R2, DeepSeek не сидит сложа руки: улучшают V3, расширяя её контекст. Это умный ход — не зацикливаться на одной модели, а эволюционировать вширь.

Гонка за контекстным окном — это гонка за практической полезностью. Не за красивыми метриками, а за тем, что можно применить в реальной работе.

Резюме от автора

DeepSeek V3.1 — не просто патч. Это ответ конкурентам, которые упёрлись в потолок контекста. Если компания действительно доведёт окно до миллиона токенов без потери качества, мы получим инструмент, который изменит подход к анализу данных. Пока тестирование открыто — стоит попробовать. Особенно если вы работаете с большими документами. Я бы поставил на то, что именно длина контекста станет главным критерием выбора LLM в 2025 году. Не количество параметров, не скорость, а то, как долго модель может помнить ваш разговор.

Опубликовано: Мировое обозрение Источник