Вышла DeepSeek 3.1 с улучшенной памятью и поддержкой более крупных запросов
Почему DeepSeek V3.1 — это не просто апдейт, а смена парадигмы контекста
Китайский стартап DeepSeek снова в деле. На этот раз — обновление модели V3. Версия 3.1 уже доступна для тестирования. Главная фишка — увеличенное контекстное окно. Звучит как обычный апдейт? Не совсем. Это меняет то, как мы работаем с нейросетями. И вот почему.
Контекстное окно — это объём информации, который модель «помнит» во время диалога. Чем оно больше, тем длиннее может быть беседа без потери нити. У предыдущей V3 было 128 000 токенов — примерно 200 страниц текста. Этого хватало для большинства задач. Но для анализа книг, код-баз или длинных переписок — уже впритык. V3.1, по неофициальным данным, расширяет окно до 1 миллиона токенов. Это около 1500 страниц. Цифра, которая раньше была доступна лишь Gemini от Google.
Увеличение контекстного окна в 10 раз меняет саму архитектуру взаимодействия: вместо 'вопрос-ответ' мы получаем 'аналитическую беседу'.
Что даёт большой контекст на практике
Допустим, вы юрист. Загружаете договор на 500 страниц и задаёте вопросы по любому пункту — модель помнит всё. Или вы разработчик: кидаете в чат весь репозиторий, а потом спрашиваете про архитектуру. Никакой потери контекста. Раньше приходилось разбивать документ на куски, теряя связи между частями. Больше нет. Это не эволюция — это скачок.
Сравнение V3 и V3.1 (по имеющимся данным)
| Параметр | DeepSeek V3 | DeepSeek V3.1 (оценка) |
|---|---|---|
| Контекстное окно | 128K токенов | ~1M токенов |
| Максимальная длина диалога | ~200 страниц | ~1500 страниц |
| Время ответа (типичный запрос) | ~1.5 с | ~2 с (возможно, чуть медленнее) |
| Доступность | API, чат | Тестирование, скоро API |
Цифры по V3.1 — неофициальные. Компания не раскрыла точных характеристик. Но даже такой апгрейд ставит DeepSeek в один ряд с лидерами индустрии — при том что затраты на обучение у них были в разы ниже, чем у OpenAI.
Недавно я тестировал DeepSeek R1 на задаче анализа юридических документов. После 50 страниц модель начинала путать факты. V3.1 с увеличенным контекстом может решить эту проблему. Жду возможности проверить лично. Но уже сейчас видно: ставка на память — правильный ход.
Как использовать длинный контекст DeepSeek V3.1: три простых сценария
- Анализ договоров и контрактов — загрузите до 1500 страниц, задавайте вопросы по каждому разделу. Модель найдёт противоречия, которые вы упустили.
- Поддержка клиентов с полной историей — чат-бот помнит все обращения за месяц. Никаких повторных объяснений.
- Работа с исходным кодом — киньте в окно весь проект (до 1 млн строк кода) и спрашивайте про баги, зависимости или архитектуру.
Моё мнение: сейчас многие LLM хороши в рассуждениях, но их память — узкое место. DeepSeek делает ставку на то, что нужно бизнесу: работа с большими объёмами данных в одном сеансе. Да, возможно, скорость инференса чуть упадёт — но это плата за глубину. И она оправдана.
Параллельно в Китае говорят о задержке модели R2. Причина — перфекционизм CEO Лян Вэньфэна и проблемы с поставками чипов Nvidia. Пока рынок ждёт R2, DeepSeek не сидит сложа руки: улучшают V3, расширяя её контекст. Это умный ход — не зацикливаться на одной модели, а эволюционировать вширь.
Гонка за контекстным окном — это гонка за практической полезностью. Не за красивыми метриками, а за тем, что можно применить в реальной работе.
Резюме от автора
DeepSeek V3.1 — не просто патч. Это ответ конкурентам, которые упёрлись в потолок контекста. Если компания действительно доведёт окно до миллиона токенов без потери качества, мы получим инструмент, который изменит подход к анализу данных. Пока тестирование открыто — стоит попробовать. Особенно если вы работаете с большими документами. Я бы поставил на то, что именно длина контекста станет главным критерием выбора LLM в 2025 году. Не количество параметров, не скорость, а то, как долго модель может помнить ваш разговор.

















