|
#роботы_атакуют #слава_роботам #роботы_ии
Рынок оперативной памяти летит вниз, потому что Google представил алгоритм TurboQuant, который снижает потребление памяти в 6 раз и ускоряет работу до 8 раз, что может резко обрушить спрос на память со стороны ИИ-индустрии. На этом фоне акции производителей уже падают: Micron Technology — минус 23%, SanDisk — минус 11%, Samsung, Seagate, SK Hynix и Kioxia — примерно минус 6%, общее снижение рынка оценивается в 11%. Пик «RAM-безумия» пришёлся на начало 2025 года, когда цены на память взлетали на 200–400%. И тут внезапно Сбер выложил GigaChat 3.1 Ultra и GigaChat 3.1 Lightning под MIT-лицензией. Код и веса уже лежат в открытом доступе — любой желающий может адаптировать готовое решение Сбера под свои задачи. По цифрам: — Ultra: 702B параметров, из них 36B активных на токен, контекст 131K — Lightning: 10B параметров, 1.8B активных, контекст 256K Инсайдеры мне говорят, что GigaChat Ultra обходит Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning. А Lightning — маленькая MoE-модель, которая на аренах показывает уровень сильно выше того, что обычно ждёшь от формата с 1.8B активных параметров. Команда разобралась с проблемой зацикливания. Перевели один из этапов пост-обучения в FP8 — это позволило снизить расход памяти примерно вдвое без заметной просадки по качеству. И ещё нашли критичный баг в SGLang, который мешал нормальной работе и портил результаты. Это релиз, где видно взрослую инженерную работу: новая архитектура, MoE, длинный контекст, разбор реальных поломок, фиксы в пайплайне и нормальная попытка сделать открытые модели не для галочки, а для реального продакшена. вчера в 22:21
3 |