↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Odio inventar nombres
9 апреля 2023
Aa Aa
#картинки_в_блогах #нейросети #нейросеть

Итак, продолжаю вчерашние эксперименты, хотя сегодня с меньшей интенсивностью из-за бытовых дел. Вчера появилось наблюдение, что сетка неплохо создаёт природные объекты, которые не имеют регулярной структуры, зато часто страдает проблемами с регулярными объектами. Самолёт, девушка на велосипеде, ночной город показывают суть проблемы — структура нарушена, с частями тела или механизма происходит вообще непонятно что.

Сейчас попробую это проверить. На первом этапе планирую несколько примеров общего описания сцены без попыток детализации. Это будет совместной проверкой анализа текста, построения сцены с добавлением деталей по умолчанию и окончательного формирования изображения.

Погнали. Вот сцена для затравки.


Стоянка машин на площади перед супермаркетом, солнечный летний день. Общий вид сцены неплох, разве что самого супермаркета не видно, но это и не было требованием, чтобы он был в кадре. Если начать приглядываться к деталям, то заметны проблемы. Некоторые машины искривлены, со спущенными колёсами или вообще без колеса. На заднем плане слева жёлтое здание без крыши. Но всё-таки удивительно, что по такому общему описанию на естественном языке при помощи (гигантского) массива данных и набора довольно-таки простых формул возможна генерация вполне реалистичного изображения.
9 апреля 2023
11 комментариев

Фургон привёз молоко в магазин. Есть какая-то тачка и какое-то здание (магазин, вид со двора?). На первый взгляд выглядят узнаваемо, а точной спецификации не было. При детализации даже какую-то надпись на машине сделала на неизвестном науке языке. Справа на заднем плане какой-то непонятный объект, частично похожий на автомобиль. Деталей по умолчанию в этот раз немного. В целом, приемлемо.

Витрина с фруктами в супермаркете. Тот случай, когда нерегулярность оказывается очень в тему — такая витрина выглядит намного реалистичнее, чем квадратно-гнездовая. Разновидности фруктов я бы назвать не смог — сами сгенерировались без спецификации, но чётко видно, что они разбиты по видам, висят какие-то ценники. В общем, правдоподобно.

Очередь покупателей на кассе в супермаркете. А вот это уже интереснее. Появились людишки — появились проблемы. Альтернативная анатомия, несоразмерный витринам рост. И watermark на изображении. Несколько странно выглядит. Хотя для первого поколения таких сеток сойдёт.

На этом пора закончить с магазинной тематикой и сходить в магазин в реале. Заодно и вид сравню. :)

Потом надо порисовать ещё объектов с регулярной структурой и посмотреть, в каких случаях нарушение регулярности идёт на пользу реалистичности, а в каких создаёт проблемы.
К фруктам: делала натюрморт, сначала по строгому запросу (не вышло, совсем), потом упрощала. Проблемы всегда с формой (апельсины и близко не круглые) и с тем, как фрукты расположены (насажены на край ящика, тарелки, ветку и т.д.). Ну и просто некий микс из фруктов с элементами сюрра делал. Это все без запросов на абстракцию и т.п.
Граждане подсказывают "грязный хак": для получения более качественных изображений нужны более подробные и детализированные промпты, их можно генерировать чере ChatGPT и уже полученный промпт скармливать Stable Diffusion (или что там ты гоняешь).

И кстати, если гоняешь локальный срез (типа Voldy Retard или подобного), его очень желательно дополнительно дообучать, базовые модели (по крайней мере в открытом доступе) пока такие себе.
Мне кажется надо использовать разные сетки.
Давать им один и тот же запрос.

Они очень друг от друга отличаются.

Пятиэтажный дом, четыре подъезда, вид со двора, солнечный летний день. Далеко от того, что можно было бы ожидать. Добавленные детали, вроде машин и лестницы, тоже сгенерированы неудачно. Погода и автоматически добавленные деревья нормальные.

Железнодорожный мост через реку, вид с моста, солнечный летний день. «Вид с моста» проигнорировано, хотя формально допустимо — не указано же, с какого моста. Картинка в целом ничего, только мост из кусков склеен и отражения в воде нарушены. Отдельные фрагменты выглядят достаточно реалистичными, но этот вопрос в целом понятен — на чём сетка обучилась, то и выдаёт.

Оазис в пустыне, вечер, человек сидит у воды, верблюд пьёт воду. А вот тут получилась хрень. И пейзаж, и живые существа. Никакой абстракции, фантасмагории, специального стиля не заказывал. Оно само.

Девушка играет на гитаре в светлой комнате. Оформление комнаты, конечно, своеобразное. А анатомии сеть ещё обучать и обучать. Но если оставить в стороне реалистичность, то в чём-то даже стильно.

Шоссе в большом городе вечером в час пик, рядом с пешеходным переходом. «Час пик» и «пешеходный переход» проигнорированы. В целом, изображение узнаваемое. Погрешности есть.
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть