↓
 ↑
Регистрация
Имя/email

Пароль

 
Вход при помощи VK ID
временно не работает,
как войти читайте здесь!
Jinger Beer
вчера в 22:21
Aa Aa
#роботы_атакуют #слава_роботам #роботы_ии

Рынок оперативной памяти летит вниз, потому что Google представил алгоритм TurboQuant, который снижает потребление памяти в 6 раз и ускоряет работу до 8 раз, что может резко обрушить спрос на память со стороны ИИ-индустрии.

На этом фоне акции производителей уже падают: Micron Technology — минус 23%, SanDisk — минус 11%, Samsung, Seagate, SK Hynix и Kioxia — примерно минус 6%, общее снижение рынка оценивается в 11%. Пик «RAM-безумия» пришёлся на начало 2025 года, когда цены на память взлетали на 200–400%.

И тут внезапно Сбер выложил GigaChat 3.1 Ultra и GigaChat 3.1 Lightning под MIT-лицензией.

Код и веса уже лежат в открытом доступе — любой желающий может адаптировать готовое решение Сбера под свои задачи. По цифрам:

— Ultra: 702B параметров, из них 36B активных на токен, контекст 131K
— Lightning: 10B параметров, 1.8B активных, контекст 256K

Инсайдеры мне говорят, что GigaChat Ultra обходит Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning.

А Lightning — маленькая MoE-модель, которая на аренах показывает уровень сильно выше того, что обычно ждёшь от формата с 1.8B активных параметров.

Команда разобралась с проблемой зацикливания. Перевели один из этапов пост-обучения в FP8 — это позволило снизить расход памяти примерно вдвое без заметной просадки по качеству. И ещё нашли критичный баг в SGLang, который мешал нормальной работе и портил результаты.

Это релиз, где видно взрослую инженерную работу: новая архитектура, MoE, длинный контекст, разбор реальных поломок, фиксы в пайплайне и нормальная попытка сделать открытые модели не для галочки, а для реального продакшена.
вчера в 22:21
1 комментарий
Ничего не понятно, но очень интересно: держи нас в курсе! 😉
ПОИСК
ФАНФИКОВ











Закрыть
Закрыть
Закрыть