Asteroid: #нейросети #размышления Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал

#нейросети #размышления

Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.

Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.

Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать»

https://chatjimmy.ai/

Модель тупенькая, но скорость потрясающая. Почти мгновенная.
И вот я задумался: именно вот такое исполнение будет достаточно дешевым в плане энергозатрат, чтобы соединять нейроимплант в башке человека с нейросетью. Сейчас ЛЛМки обрабатывают текст, насколько сложно дополнить их ллмкой обрабатывающей внутренний диалог через прямое чтение мозга? А если имплант может "читать" внутренний диалог, то кто мешает его "записать"?

Так-то, это уже практически готовые нейросети из игры Eve online. Только нейросети не "заливаются" уколом, а операция + сьемный чип снаружи. Все базы знаний в чипе. Хочешь обновить базу, или установить другую - покупай новый чип.
Работает очень просто: достаточно человеку подумать, ллмка прочтёт мысль, увидит в базе ответ, и впишет его в внутренний диалог. Внутри это должно выглядеть, как появляющаяся в голове мысль, продолжающая вопрос.

В целом, если бы я не знал о том, для чего захотят использовать эту технологию власти, я был бы полностью за.
Имхо, сторонники теории заговора много паникуют о том, что их мысли будут читать. Хотя по-настоящему надо бояться того, что мысли им будут записывать.

21 февраля в 21:00

Отключить рекламу

8 комментариев

	ar neamhni 21 февраля в 21:03
Я когда-то писала такой киберпанк. Но он был йашный...

	Ногa 21 февраля в 21:04
>3b parameters Передовые модели около 10T, в 3000 раз больше

Marlagram Онлайн

21 февраля в 21:05

Вот только полноценные для практического применения модели llm по мнению многих теоретиков как раз должны преодолеть разделение на обучение и использование, без рефлексии дообучения в ходе эксплуатации, причём с самоконтролем ошибок реальной полезности достичь...

Djarf

21 февраля в 21:05

Основная "страшилка" для сторонников теории заговора, на мой взгляд, состоит не только и не столько в трансляции нужных мыслей, сколько в контроле работы желёз внутренней секреции, что обеспечит контроль над самим организмом. Так сказать, человек с чипом превратится в биоробота.

	Asteroid 21 февраля в 21:14
Marlagram > Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.

	ae_der Онлайн 22 февраля в 12:59
Имеет смысл как средство для фиксированной задачи. Распознавать, танк это или не танк в беспилотнике. Переводить с языка на язык. Генерировать картинки. Главное, чтобы для задачи не требовалось дообучение.

Asteroid

22 февраля в 14:28

ae_der
См. выше - некоторое дообучение оно поддерживает.
Теоретически можно запечь любую модель, в том числе универсальную. Просто специализированная имеет больше смысла, потому что задачи для них меняются не очень быстро.

	ae_der Онлайн 23 февраля в 12:43
Asteroid Не бывает универсальных моделей. Точнее, любая модель без постоянного переобучения - чрезвычайно ограничена, как человек, страдающий от ежедневной потери памяти.

Натуральный блондин гет	+233
Аз воздам или Круги на воде джен	+75
Высокое искусство кулинарии, зельеварения и уползания джен	+19
Овечья гора гет	+10
Проклятый феникс гет	+10
Роковая пятница джен	+9
Навья косточка джен	+8
Месть Снейпа джен	+8
И грянул гром гет	+7
Девушка с Алмазных гор гет	+7