Небольшой возврат к классике этого треда. Microsoft Research утверждают, что можно обучать LLMы с тритами (тернарными битами) вместо чисел с плавающей запятой, без потерь. Много интересных следствий, например то, что модели на 200+B будут влезать в один GPU.
https://arxiv.org/abs/2402.17764
Ожидаю внешних проверок на следующей неделе. (кода как водится нет)
>>/4076/
Безупречная проекция, просто уморительно.
Забавно даже, что я всё так угадал, когда ИИ реально был мусором и оставалось пространство для сомнений. Даже Stable diffusion никакого не существовало, я тогда vqgan-clip-ами игрался. Но логика ситуации лично мне была ясна.
А вот вы, скотинки, действительно умрёте на холме, где не происходит и не может происходить ничего, кроме рыночного надувательства, сжимая в слабеющих лапках обнадёживающие новостные заметочки. Когда на заводах будут ебашить роботы, вы будете мусолить статейки о том, как робот наступил на ногу пролетарию Васе или уронил паллеты.
>>/4077/
> Вот как твой караван идёт к сингулярности, кста.
Ты иск-то открывал? Или просто новость увидел?
> В реальности это несколько караванов, которые грызут друг друга за ноги из-за профита,
О нет, только не профит!