TurboQuant от Google: как алгоритм сжатия меняет рынок памяти и ИИ

Google представил TurboQuant — алгоритм, сокращающий потребление памяти в 6 раз и ускоряющий работу больших языковых моделей до 8 раз без потери качества. Технология уже вызвала падение акций производителей ОЗУ и пересмотр прогнозов спроса на рынке памяти, где цены на DDR5 росли на 200–400% в 2025…

TurboQuant от Google: как алгоритм сжатия меняет рынок памяти и ИИ

TurboQuant от Google: новый алгоритм, изменивший рынок памяти

Google представил TurboQuant — алгоритм сжатия данных для больших языковых моделей и векторных поисковых систем. По заявлению компании, он сокращает потребление памяти в шесть раз и ускоряет работу моделей до восьми раз без потери качества. Технология была анонсирована 26 марта 2026 года на конференции ICLR и сразу же вызвала реакцию на рынке оперативной памяти.


Как TurboQuant перераспределяет ресурсы

Алгоритм работает с KV-кэшем — хранилищем промежуточных данных (ключей и значений), которое ускоряет генерацию текста в больших языковых моделях. В основе лежат два метода:

  1. PolarQuant преобразует данные в полярное представление (радиус + угол), упрощая их структуру. Это позволяет сжимать информацию до трёх бит на значение вместо стандартных тридцати двух без потерь.
  2. QJL (Quantized Johnson-Lindenstrauss) кодирует остаточные ошибки в один бит на значение, сохраняя точность вычислений.

В результате объём KV-кэша сокращается в шесть раз, а инференс ускоряется до восьми раз, особенно на современных GPU, таких как Nvidia H100. При этом алгоритм не требует переобучения моделей и совместим с существующими архитектурами.


Рынок памяти: от роста к коррекции

После анонса TurboQuant крупнейшие производители памяти и флеш-накопителей понесли существенные убытки. Акции Micron Technology упали на 23 %, SanDisk — на 11 %, а Samsung, SK Hynix, Seagate и Kioxia снизились на 6 % каждая. Общее падение рынка оценивается в 11 %.

Рост спроса на память в последние два года был во многом обусловлен развитием ИИ-инфраструктуры. В начале 2025 года цены на DDR5 выросли на 200–400 %, но теперь аналитики пересматривают прогнозы. Производители (Micron, Samsung, SK Hynix) вынуждены адаптироваться, сокращая выпуск или переориентируясь на другие сегменты, такие как автомобильная электроника и IoT.


Цены на память: что ждёт рынок

В краткосрочной перспективе цены на ОЗУ останутся высокими из-за инертности производственных цепочек и долгосрочных контрактов. Однако в среднесрочной (6–12 месяцев) ожидаются изменения:

  • Снижение оптовых цен на память по мере поиска производителями новых рынков сбыта.
  • Усиление конкуренции со стороны китайских компаний, которые раньше не могли конкурировать с лидерами рынка.
  • Падение цен на готовые ПК и ноутбуки, если память подешевеет.

Для конечных пользователей выгоды будут ограниченными, так как TurboQuant ориентирован на серверные и ИИ-системы. Память для домашних ПК и игровых консолей может подешеветь, но незначительно.


Мнения экспертов и стратегии инвесторов

Аналитики расходятся в оценках влияния TurboQuant. Одни считают его эволюционным, но не революционным решением: долгосрочный спрос на память останется высоким, хотя темпы роста замедлятся. Другие, например, аналитик SemiAnalysis Рэй Ван, предполагают, что рост эффективности может стимулировать разработку более сложных моделей, требующих новых чипов.

Инвесторы предпочли зафиксировать прибыль, так как акции производителей памяти за последний год выросли на 200–300 %. Производители ИИ-оборудования, включая Nvidia, могут столкнуться со снижением спроса на дорогие GPU, поскольку модели станут более эффективными.


Технические ограничения и неопределённости

TurboQuant не требует переобучения моделей и работает на существующих архитектурах, но его влияние ограничено:

  • Алгоритм ускоряет только этап инференса, оставляя обучение LLM таким же ресурсоёмким.
  • Для обычных пользователей (игры, офисные приложения, мультимедиа) выгоды минимальны, так как технология оптимизирована для серверных и ИИ-задач.

Остаются вопросы о масштабируемости технологии в реальных продакшен-средах. Неясно, как быстро другие компании — Nvidia, Meta*, Microsoft — внедрят TurboQuant в свои продукты. Также нет однозначного ответа на вопрос, приведёт ли улучшение эффективности к снижению спроса на память или, напротив, стимулирует разработку более сложных моделей, требующих новых чипов. В любом случае, рынок памяти ждёт период адаптации, а производители — пересмотр стратегий.

  • Meta, Instagram, WhatsApp и Facebook запрещены и порицаемы в России.

Read more

Startpage: как работает поисковик без слежки за пользователями

Startpage: как работает поисковик без слежки за пользователями

Startpage — первый в мире частный поисковик, который не собирает личные данные, не профилирует пользователей и не передаёт информацию третьим лицам. Он использует технологию Google, но выдаёт обезличенные результаты, а также предлагает инструмент Anonymous View для скрытия IP-адреса при переходе на…

Почему интеллект — редкость и как с этим жить

Почему интеллект — редкость и как с этим жить

Артур Шопенгауэр утверждал, что способность к критическому мышлению встречается у 5% людей, а остальные действуют на уровне инстинктов. Как взаимодействовать с большинством, которое не способно воспринимать сложные идеи, и почему уединение становится необходимым для умных?

Запуск первых 16 спутников группировки «Рассвет»

Запуск первых 16 спутников группировки «Рассвет»

Компания «Бюро 1440» успешно вывела на орбиту первые 16 серийных спутников низкоорбитальной группировки «Рассвет», оснащённых связью 5G NTN, лазерной межспутниковой связью и плазменными двигателями. Запуск стал важным этапом на пути к созданию российской альтернативы глобальным спутниковым системам…