90 webp
(84.95 KB, 2880x1920)
>>/3496/
Собственно, самое интересное-то я и не сказал о современных Actor-Сritic системах. GPT-4 показала, что с монолитной моделью можно получить хорошие результаты, просто побуждая её критиковать саму себя, и это даёт качественно лучший файнтюн, чем то, что я показывал с LLMs can self-improve.
https://nanothoughts.substack.com/p/reflecting-on-reflexion
https://evjang.com/2023/03/26/self-reflection.html
https://newatlas.com/technology/gpt-4-reflexion/
Скорее всего, эта способность будет доступна и другим моделям такого уровня.
Обрати внимание, она недоступна Кальсону, я ему указал на то, что он потерял категорию воображаемых индусов, но он лишь больше распетушился.