Я пока дошел до такого алгоритма:
1. пишу в одну нейронку, что что я хочу - она делает промт.
2. кидаю этот промт в другую (или несколько), та генерит картинку.
3. возвращаюсь с лучшим результатом в первую и говорю, что нужно поправить (последнее время это Kimi, она неплохо распознает картинки, что удобно).
4. повторять 1-3 пока не надоест))