設置 | 登錄 | 註冊

目前共有4篇帖子。

图像生成模型训练实验

1樓 悄悄打开魔盒 2026-2-24 20:53
首先训练了VAE作为图像压缩模型,然后训练DiT作为图像生成模型
目前还只训练了imagenet,一百多万张图,1000类,类别标签生图,后续考虑加上文本生图
2樓 悄悄打开魔盒 2026-2-24 20:56
150000步采样(batchsize=32,按照这个计算,全数据集每张图已经过了四遍):

悄悄打开魔盒单张3090训练速度非常有限,一小时只有一万步左右,所以到现在还看不出来什么稳定的图像
悄悄打开魔盒回复 @悄悄打开魔盒:初学者建议先使用手写数字数据集MNIST或者衣服数据集Fashion-MNIST,图片小,训练速度快,能很快看到效果

內容轉換:

回覆帖子
內容:
用戶名: 您目前是匿名發表。
驗證碼:
看不清?換一張