>>/639/
2.0 на руколице сгенерила мне совершенно адекватную четырёхрукую богиню. Я даже не мудрил с промптами.
>>/656/ >>/658/
%%Тред такой. Скажи спасибо, что мы не на доброчане, там бы пришлось hand palm и shizo talks to himself разглядывать вместо картинок.%%
%%что тут за разметка?%%
Вообще, в эти красивые аниме-картинки пошло много труда. Там всё другое. Другая сама модель, это скорее всего какой-то микс базового SD, порномодели вроде F111/F222 и waifu/AnythingV3 (ждём вайфу 1.4, она будет лучше всего этого), причём микс имеет параметры помимо процентного отношения. Другие семплеры. Clip skip. Совсем, совсем другие промпты, c усиленными и ослабленными словами, заклинаниями из художников и тегов. И ещё небось с полным ворованным NovelAI стеком, с гипернетворками и утроенным токенайзером.
Главное, что используется негативный промптинг. Это забавный хак, unconditional conditioning. Упрощая, диффузия в SD пытается максимизировать на каждом шаге дельту между следующей из шума картинкой, больше соответствующей твоему запросу, и картинкой, соответствующей *ничему конкретному*. Но вместо такого девственного шума (на самом деле он не очень девственный, но...) можно использовать шум, который направляется другим промптом, и таким образом задать направление, противоположное тому, к которому ты стремишься, кагбе дообъяснив модели свою идею и сократив пространство поиска. В NovelAI по умолчанию такой негативный промпт - lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
https://invoke-ai.github.io/InvokeAI/features/PROMPTS/
Вот нарисованный краб с отрицательной и положительной [photography] (угадай где какой промпт).
Все эти секреты описаны на rentry.org и размазаны по сообществам промптеров. проще всего воровать из шапки треда на форчке. Например https://rentry.org/sdg_FAQ
А ещё теперь есть midjourney v4 и niji journey, с которыми особо не посоревнуешься. Но это платно.
> А почему нет обратного, загружаешь картинку, а оно описывает в своих терминах её,
Потому что CLIP Interrogator не настолько хорош, чтобы угадывать юзкейс и культуру промптинга. Кейворд вроде WLOP может очень слабо влиять на картинку в сравнении с вектором вроде "кошачье ухо".
Но ты можешь вручную проверять CLIPом пакет векторов типичных кейвордов. Если, конечно, CLIP знает эти вещи, и они не являются сугубо прерогативой файнтюненной модели.