thumbnail of 0ae71474-0636-4cde-a993-4e84f7ed46e8_1600x584.png
thumbnail of 0ae71474-0636-4cde-a993-4e84f7ed46e8_1600x584.png
0ae71474-0636-4cde-a9... png
(60.75 KB, 1600x584)
thumbnail of photo_2023-04-04_15-40-57.jpg
thumbnail of photo_2023-04-04_15-40-57.jpg
photo_2023-04-04_15-4... jpg
(91.71 KB, 1080x559)
thumbnail of 90.webp
thumbnail of 90.webp
90 webp
(84.95 KB, 2880x1920)
 >>/3496/
Собственно, самое интересное-то я и не сказал о современных Actor-Сritic системах. GPT-4 показала, что с монолитной моделью можно получить хорошие результаты, просто побуждая её критиковать саму себя, и это даёт качественно лучший файнтюн, чем то, что я показывал с LLMs can self-improve. 

https://nanothoughts.substack.com/p/reflecting-on-reflexion
https://evjang.com/2023/03/26/self-reflection.html
https://newatlas.com/technology/gpt-4-reflexion/

Скорее всего, эта способность будет доступна и другим моделям такого уровня.

Обрати внимание, она недоступна Кальсону, я ему указал на то, что он потерял категорию воображаемых индусов, но он лишь больше распетушился.