29 января в 09:21
|
|
Muse from Mars
Нейронка скушала рисунки, в неё изначально записан какой-то алгоритм для оценки этих скушанных рисунков. Алгоритм в ходе обучения присваивает условные "веса" тому, что изображено на рисунках. И то это будет условное "красно-коричневое чередующиеся с чёрным пятно - тигр или тигровый рулет. Если в запросе есть слово тигр, то пихаем красно-коричневое с чередующиеся чёрным пятно". (На самом деле очень условно, там ещё море математических абстракций внутри этой уже человекопонимаемой логики всунуто). В итоге каждая картинка в пуле обучения нейронкой разобрана по куче параметров, выделены максимумы соответствия цветных пятен к терминам в последующем промпе, и в каких комбинациях терминов какого рода изображения соответствуют. При этом сама нейронка оперирует числами. А наши промпы чуть ли не другая, натасканная на тексты, переводит в команды понятные уже той, что рисует (до мижорней и прочих промтовых, были уже сетки, которые генерировали что-то, но использовались различные ползунки параметров) И те, кто уже долго мучают нейронка, в той, с которой работают, уже знают, что где-то надо кусок запроса повторить несколько раз, по сути написать одно и то же в разных формулировках, что где-то что-то почти способно внятно понять обычно написанный текст, а где-то надо свои хотелки пихать отдельными словами, чтобы оно хоть что-то поняло, где-то в формировании рисунка самое важное и весомое надо писать в самом начале промта, какие-то вещи совершенно невозможно получить в нужном стиле, так как в этом стиле у нейронки нет примеров, а в другом - кушай, не обляпайся. И люди просто уже освоились со всеми этими нюансами. И так что с рисовательными, что с музыкой, что с текстами - везде есть свои правила ввода запроса и нюансы, когда результат будет получше. 1 |