Google остудила рынок памяти?
Почему TurboQuant от Google напугал рынок памяти: честный разбор
Google Research выпустила TurboQuant. Технология сжимает KV-cache в шесть раз. Инференс больших языковых моделей ускоряется до восьми раз. Рынок DRAM дрогнул. Акции memory-компаний просели. Пресса заговорила: «Память больше не нужна?»
Спойлер: нет. Но история интереснее, чем кажется. Разберёмся без паники.
Что такое TurboQuant и почему о нём заговорили
KV-cache — это «промежуточная память» при генерации текста. Чем длиннее ответ модели, тем больше она жрёт DRAM. TurboQuant применяет новую схему квантования. Сжимает данные без потери точности. Результат — меньше памяти на серверах, меньше затрат.
Для производителей чипов — тревожный звонок. Если модели требуют меньше DRAM, спрос на серверную память может замедлиться. Инвесторы это прочитали как «конец бума». На деле — корректировка ожиданий.
Технология не отменяет роста ИИ. Она делает его дешевле. А дешёвый инференс — это больше задач, больше моделей, больше данных.
Реакция рынка: паника или переоценка
После анонса акции Samsung, SK Hynix и Micron упали на 3–5%. TrendForce написал разбор: не станет ли TurboQuant «головной болью» для memory-плееров? Но спотовые цены на DDR5 не рухнули. В Европе 32-гигабайтные комплекты Corsair и Kingston снизились на 10–15% — но это откат после пиков.
В США цены держатся. Контракты на апрель обещают рост. Рынок памяти инерционен. Одна технология, даже от Google, не переворачивает его за неделю.
Личное наблюдение: я слежу за розницей последние месяцы. Даже когда появляются новости о снижении спроса, в магазинах цены стоят. Продавцы не спешат скидывать — ждут следующего покупателя.
Сравнение: было и стало с TurboQuant (в теории)
| Параметр | Без TurboQuant | С TurboQuant |
|---|---|---|
| KV-cache (на 1000 токенов) | ~1 ГБ | ~167 МБ |
| Затраты инференса (7B модель) | ~4,5 ГБ DRAM | ~1,2 ГБ DRAM |
| Скорость генерации | ~40 токенов/с | до 320 токенов/с |
Цифры впечатляют. Но это в идеальных условиях. На практике нужна поддержка железа, софта и адаптация под конкретные модели. Массовое внедрение — минимум год.
Почему в России цены не упадут (и не упали)
Глобальная коррекция доходит до нас с задержкой и в ослабленном виде. Логистика, параллельный импорт, курс — свои поправки. Пример: 32 ГБ DDR5 в мире стоила ~$150, в РФ — 45–50 тыс. руб. Даже если оптовая цена упадёт на 20%, розница среагирует слабо.
К тому же дефицит валютной ликвидности у импортёров. Память закупают валютой, а рубль колеблется. Наценка каналов не снижается. В итоге — «защита» от мировых трендов.
Ещё факт: производители памяти перенаправили мощности под HBM и серверные решения. DDR5 для потребителей теперь не приоритет. Даже если спрос на серверную память слегка охладится, на рознице это скажется не сразу.
Покупателям в РФ не стоит ждать дешёвой оперативки до 2027 года. Новые фабрики Samsung и Micron заработают не раньше.
Моё мнение: TurboQuant — это не «убийца DRAM»
Google показала, что математика побеждает железо. Но это не значит, что память перестанет быть востребована. Наоборот — более дешёвый ИИ вызовет рост числа инференс-серверов, а значит, и суммарного потребления DRAM. Дживонг Таек (аналитик TrendForce) уже говорил: спрос будет расширяться, а не сжиматься.
Для инвесторов — сигнал: не все производители памяти одинаково выиграют. Для инженеров — толчок к новым алгоритмам. Для обычных пользователей — ничего не изменится. Пока.
Коротко: TurboQuant — важный шаг, но рынок памяти не рухнет. Он станет сложнее, гибче и, возможно, чуть менее прибыльным для монополистов. А цены в магазинах — они упадут, когда появятся новые заводы. Не раньше.















