![]() |
|
С мечом прям на песню картинки ложатся хорошо иллюстрациями:
"Я блуждаю всю жизнь в лабиринте дорог И ношу смерть за правым плечом." (Тэм) |
![]() |
|
Грызун
Показать полностью
Можно, но онлайн инструментов не подскажу. Если брать интерфейс Automatic1111, в моем случае его производная Forge, то это Sketch в разделе метода Image2Image. Я им почему-то практически не пользуюсь, а похоже зря. Результаты примерно вот такие: Максимально кривой скетч ![]() Промпт black cat, autumn leaves с денойзингом 0,75. Из-за слишком низкого коэффициента новизны получилась только кошка, и единственное изображение с явно выраженным листом. ![]() Тоже самое, но с денойзом в 1. Из-за максимального коэффициента появилось много новых деталей. ![]() ![]() Чуть изменил промпт, теперь он 1cat, solo, black cat, autumn leaves on ground и опустил денойз до 0,9. Детали пропадают и оно не знает что делать с оранжевым пятном, но листья по сравнению с первым вариантом уже заметнее. ![]() ![]() Еще немного меняем промпт 1cat, solo, black cat, autumn leaves on ground, view from above, и даем чуть больше свобод денойзом в 0,95. ![]() ![]() Убираем лишнее упоминание кота solo, black cat, autumn leaves on ground, view from above и возвращаем денойз на 1. ![]() ![]() Не идеально, но пользоваться можно, как и всегда с нейронками придется делать много повторений для получения нужного результата. 3 |
![]() |
|
Дядюшка Ди
Показать полностью
Грызун Вау, спасибо!Можно, но онлайн инструментов не подскажу. Если брать интерфейс Automatic1111, в моем случае его производная Forge, то это Sketch в разделе метода Image2Image. Я им почему-то практически не пользуюсь, а похоже зря. Результаты примерно вот такие: Максимально кривой скетч https://i.imgur.com/wNGziwN.png* Промпт black cat, autumn leaves с денойзингом 0,75. Из-за слишком низкого коэффициента новизны получилась только кошка, и единственное изображение с явно выраженным листом. https://i.imgur.com/U73CS12.png* Тоже самое, но с денойзом в 1. Из-за максимального коэффициента появилось много новых деталей. https://i.imgur.com/uZyT1nb.png* https://i.imgur.com/nrzKnHf.png* Чуть изменил промпт, теперь он 1cat, solo, black cat, autumn leaves on ground и опустил денойз до 0,9. Детали пропадают и оно не знает что делать с оранжевым пятном, но листья по сравнению с первым вариантом уже заметнее. https://i.imgur.com/vJLfU8A.png* https://i.imgur.com/nGrtwBu.png* Еще немного меняем промпт 1cat, solo, black cat, autumn leaves on ground, view from above, и даем чуть больше свобод денойзом в 0,95. https://i.imgur.com/PtxA9XB.png* https://i.imgur.com/djm2tFy.png* Убираем лишнее упоминание кота solo, black cat, autumn leaves on ground, view from above и возвращаем денойз на 1. https://i.imgur.com/yAgFO96.png* https://i.imgur.com/DCqZnvl.png* Не идеально, но пользоваться можно, как и всегда с нейронками придется делать много повторений для получения нужного результата. Image2Image с наброском поищу, это уже термины, дающие отправную точку. Кошка, задумчиво смотрящая в рыжую даль вышла забавная ХД А почему кошка всё ещё двоится на последних картинках, после того как слова поубирали? Откуда вообще в верхнем углу темный кот, это тот самый коэффициент новизны подняли? Он и денойз это же одно и то же судя по контексту? Вроде нейронке должно быть легче, если в равномерно-рыжем пятне дать зацепки? Может сработать? Будет очень нагло, если я пришлю ваш скетч в более крапчатом варианте и попрошу проверить, что генерится? Вы вроде приглашали вас просить что-то сгенерировать, но это, наверное, про интересные генерации, а не мой уровень "потыкать в новый инструмент чем-то нарочиты примитивным, чтоб лучше понять". |
![]() |
|
Дядюшка Ди
В любом случае огромное спасибо, ваш ответ очень крутой и тянет на отдельный пост! Может запостите? Теги кому скучно уже поскрывали, а с кошкой вышло прям вдохновляюще, как эти детали появляются на глазах. (И интригующе, из какого зеркального королевства вышла вторая черная кошка) И наглядно. Реально крутой материал! |
![]() |
|
Грызун
Напишите конечно. А вот на отдельный пост оно не тянет. |
![]() |
|
Дядюшка Ди
Напишите конечно. А вот на отдельный пост оно не тянет. Что-то вот такое может сработать лучше?![]() |
![]() |
|
Грызун
![]() Изменения не столь значительные, чтобы серьезно повлиять на результат. А итог примерно такой же, чем выше денойз. тем больше свобод чувствует нейронка. Настолько больше, что от 0.95 начинает заниматься своим любимым занятие, а именно помещать объект, кажущийся ей ключевым в центр изображения, что особенно заметно на последней пачке с коэффициентом 1. Для наглядности и лучшего понимания ее зацикленности на центре изображения добавлю результаты работы того же промпта, но в классическом text2image режиме, то есть без скетча. ![]() |
![]() |
|
Настолько больше, что от 0.95 начинает заниматься своим любимым занятие, а именно помещать объект, кажущийся ей ключевым в центр изображения, что особенно заметно на последней пачке с коэффициентом 1. "Так вот оно чё, Михалыч!!"Нашла живую онлайновую генерацию( https://dezgo.com/image2image ), судя по переменному колличеству хвостов нейронка простенькая, параметров для регуляции доступно два (в платном режиме 4), плюс выбор сетки и сэмплера, что бы он ни значил. И оно действительно как одержимое тащщит кошку в центр экрана и неудержимо увеличивает. В платном режиме есть выбор числа шагов, мне по всяким мимопролетавшим видео "как генерирует нейронка" видится, что вот как раз число шагов неплохо бы уменьшить, чтоб удержать кошку на месте. Нормального ничего так и не получилось Кошки на 0,85 вышли классные и действительно ближе к скетчу. Нижняя правая вообще огонь) Я про крапчатость как раз для низких значений "денойза" думала. Где кошка на месте и не двоилась(удваивать предметы тоже постоянная фишка?), но листья не листья. Там, где в прошлый раз оно в растерянности оставляло сплошное оранжевое поле. И вроде сработало, как вы думаете? В тот раз оно выдавало поле на денойзе в 0,9 и 0,75, а теперь уже с 0,85 никакого намека на пустое оранжевое пространство. Или это промт повлиял? Или что-то ещё, может вы другую сетку взяли или другой какой параметр сдвинули? |
![]() |
|
Собственно левая нижняя кошка на 0,85 вполне подошла бы мне, она похожа на то, что воображается по описанию "черная кошка, рыжие листья".
Показать полностью
Единственное что человек в лице меня на исходном скетче "не видит" белого вокруг кошки, относит это к "фону" и "огрехам формата", которые нужно игнорировать, а нейросетка считает это белым пятном вокруг предполагаемой кошки (и в чем она не права, собственно?) и в отсутствии указаний трактует это как дорожку.(или как белые отблески на черной кошке. И то и то красиво, как по мне) То есть нуждайся я в кошке без дорожек, я бы просто в пейнте залила весь фон рыжим, набросала пятно в нужном углу и повторила бы генерацию с картинкой без единого белого пикселя. (С крапинками на листьях, чтоб не ставить сетку в тупик, да) И скорее всего результат с генерациями в районе 0,85, а то и ниже, меня вполне бы устроил. Круто! Оооооч-чень рада, что спросила у вас сначала, а не полезла в гугл искать генераторы. То что я нашла там -- сплошное разочарование и совершенно непригодно. А у вас круто вышло и видно, что это не вопрос принципиальной невозможности на текущем уровне развития цивилизации, а просто мне попались примитивные генераторы. Логично в общем для бесплатной и без регистрации версии. Спасибо, короче, что дали более приближенное к реальности представление о нейросетках! Интересно было бы попробовать что-то более анотомичное, коты-то жидкость, как известно, они любую форму принимают, а вот какие-нибудь драконы или насекомые -- с большим числом выступающих конечностей, которе должны быть хотя бы похожи левая с правой... Но не сегодня, у меня кончилось свободное время. Спасибо ещё раз, было весело! (И непонятно, что по-вашему не хватает для поста? Как раз структура хорошего школьного урока: задача, варируем то (денойз), варируем это (промпт), выходит так, а так -- этак, наглядно минут 40 занять. Может просто я валенок и ретроград, но для меня всё что вы написали -- очень новое. Не думаю, что в блогах я одна на таком уровне (не)знания. Здесь всё же по фанфикам собрались, а не по интересу к ИИ) |
![]() |
|
Грызун
Показать полностью
На самой самой первой, в промпте были просто осенние листья, в последнем сообщении уже осенние листья на земле, и дополнительно к этому появился вид сверху, чтобы оно не пыталось изображать небо. Судя по выбору моделей и тому, что оно позволяет использовать только лоры совместимые с SD1.5, это и есть SD1.5. А им нужно уметь пользоваться для достижения качественного результата. Сэмплер же, материя довольно таки тонкая, и его нужно подбирать в зависимости от ВСЕГО. Для большинства моделей с которыми я работаю, рекомендуется Euler a, но и использование других совершенно не возбраняется. Разница в используемом сэмплере лучше видна при генерации txt2img. ![]() Про другие доступные там параметры: Strength скорее всего есть Denoising strength. Count это просто счетчик изображений создаваемых за раз. Кстати, не совсем понятно, что именно они имеют ввиду, Batch count или Batch size, в пером случае это просто количество изображений за один запуск, а во втором количество одновременно (параллельно) генерируемых изображений, и вот именно второй вариант уже может повлиять на результат при высоких значениях. Guidance он же CFG Scale. Определяет насколько сильно нейронка будет пытаться следовать запросу. На большинстве моделей, при значениях начиная с 8 ужасно перенасыщает изображение. При низких значениях можно получить очень интересные результаты, но они скорее всего будут, если не блеклыми, то как минимум приглушенными. Что-то мне подсказывает, что большинство популярных и бесплатных сервисов типа Шедеврумов и Кандинских грешат задиранием этого параметра для того чтобы пользователь получал именно то, что просит, совершенно теряя в качестве изображения. Steps то есть количество шагов. Даже не знаю, может быть и поможет. Редко выпрыгиваю за рамки 25-35. Можете оценить разницу на следующем примере, заодно увидите о чем я говорил про Guidance. ![]() Upscale он и есть апскейл, то есть увеличивает исходное изображение после генерации. Он кстати совершенно бесполезен без собственного денойза, так как слишком высокое значение даст не просто новые детали, а полностью новое изображение. Я много чего могу наговорить пока есть свободные уши, а вот стоит ли меня слушать большой вопрос. Так как материалов по теме я прочитал сильно меньше, чем некоторые люди никак ее не касающиеся. Так что, почти весь имеющийся опыт получен в результате тыкания в разные кнопки и ощущений от изменений результатов. |