曾经试过类似的,你可以参考下:可以试试搭建一个小的DDPM,然后特征你用AE 或者 VQ-VAE 压缩下,貌似24G就能跑,除了训练有点慢其他还好,或者你看看能不能读取一些预训练好的权重,作为预训练权重,这样也许快一些