Специальной процедурой с конкурирующими нейросетками. Вместо того, чтобы не рисовать сразу то, что не нужно
Ну так уже. Dalle к примеру сначала производит более абстрактную репрезентацию запроса, а потом 2 раза детализирует ее. Т.е. сначала сцена и объекты, а уже потом детали этих объектов.
Или имеется в виду adversarial training? это то было с самого начала