目前有一个趋势是增加空间下采样因子,并相应地增加通道数以保持 TSR,以便在更高分辨率下进行图像和视频生成(例如 LTX-Video 中的 32×、GAIA-2 中的 44×,以及 DCAE 中的 64