Как бы, пардон, но электронной музыке и, скажем так, машинам, способным её создавать по алгоритмам тупо больше лет, чем тем же арт-нейронкам, у которых в основе - нейронке распознавания объектов.
Да и, кхм, "мерность" (частота, темп, длина волны, что там ещё было?) аудио куда ниже "мерности" (конкретные цвета и конкретное расположение точек на плоскости, определение объектп и какими точками он должен быть изображён, опять-таки добавляется вторая нейронка с распознание значения введённого текста) изображения. Три де и видео ещё сложнее...