↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Odio inventar nombres
9 апреля 2023
Aa Aa
#картинки_в_блогах #нейросети #нейросеть

Итак, продолжаю вчерашние эксперименты, хотя сегодня с меньшей интенсивностью из-за бытовых дел. Вчера появилось наблюдение, что сетка неплохо создаёт природные объекты, которые не имеют регулярной структуры, зато часто страдает проблемами с регулярными объектами. Самолёт, девушка на велосипеде, ночной город показывают суть проблемы — структура нарушена, с частями тела или механизма происходит вообще непонятно что.

Сейчас попробую это проверить. На первом этапе планирую несколько примеров общего описания сцены без попыток детализации. Это будет совместной проверкой анализа текста, построения сцены с добавлением деталей по умолчанию и окончательного формирования изображения.

Погнали. Вот сцена для затравки.


Стоянка машин на площади перед супермаркетом, солнечный летний день. Общий вид сцены неплох, разве что самого супермаркета не видно, но это и не было требованием, чтобы он был в кадре. Если начать приглядываться к деталям, то заметны проблемы. Некоторые машины искривлены, со спущенными колёсами или вообще без колеса. На заднем плане слева жёлтое здание без крыши. Но всё-таки удивительно, что по такому общему описанию на естественном языке при помощи (гигантского) массива данных и набора довольно-таки простых формул возможна генерация вполне реалистичного изображения.
9 апреля 2023
8 комментариев из 11
Margarido Онлайн
К фруктам: делала натюрморт, сначала по строгому запросу (не вышло, совсем), потом упрощала. Проблемы всегда с формой (апельсины и близко не круглые) и с тем, как фрукты расположены (насажены на край ящика, тарелки, ветку и т.д.). Ну и просто некий микс из фруктов с элементами сюрра делал. Это все без запросов на абстракцию и т.п.
Граждане подсказывают "грязный хак": для получения более качественных изображений нужны более подробные и детализированные промпты, их можно генерировать чере ChatGPT и уже полученный промпт скармливать Stable Diffusion (или что там ты гоняешь).

И кстати, если гоняешь локальный срез (типа Voldy Retard или подобного), его очень желательно дополнительно дообучать, базовые модели (по крайней мере в открытом доступе) пока такие себе.
Мне кажется надо использовать разные сетки.
Давать им один и тот же запрос.

Они очень друг от друга отличаются.

Пятиэтажный дом, четыре подъезда, вид со двора, солнечный летний день. Далеко от того, что можно было бы ожидать. Добавленные детали, вроде машин и лестницы, тоже сгенерированы неудачно. Погода и автоматически добавленные деревья нормальные.

Железнодорожный мост через реку, вид с моста, солнечный летний день. «Вид с моста» проигнорировано, хотя формально допустимо — не указано же, с какого моста. Картинка в целом ничего, только мост из кусков склеен и отражения в воде нарушены. Отдельные фрагменты выглядят достаточно реалистичными, но этот вопрос в целом понятен — на чём сетка обучилась, то и выдаёт.

Оазис в пустыне, вечер, человек сидит у воды, верблюд пьёт воду. А вот тут получилась хрень. И пейзаж, и живые существа. Никакой абстракции, фантасмагории, специального стиля не заказывал. Оно само.

Девушка играет на гитаре в светлой комнате. Оформление комнаты, конечно, своеобразное. А анатомии сеть ещё обучать и обучать. Но если оставить в стороне реалистичность, то в чём-то даже стильно.

Шоссе в большом городе вечером в час пик, рядом с пешеходным переходом. «Час пик» и «пешеходный переход» проигнорированы. В целом, изображение узнаваемое. Погрешности есть.
ПОИСК
ФАНФИКОВ













Закрыть
Закрыть
Закрыть