設置 | 登錄 | 註冊

目前共有4篇帖子。

圖像生成模型訓練實驗

1樓 悄悄打开魔盒 2026-2-24 20:53
首先訓練了VAE作為圖像壓縮模型,然後訓練DiT作為圖像生成模型
目前還只訓練了imagenet,一百多萬張圖,1000類,類別標籤生圖,後續考慮加上文本生圖
2樓 悄悄打开魔盒 2026-2-24 20:56
150000步採樣(batchsize=32,按照這個計算,全數據集每張圖已經過了四遍):

悄悄打开魔盒單張3090訓練速度非常有限,一小時只有一萬步左右,所以到現在還看不出來什麼穩定的圖像
悄悄打开魔盒回復 @悄悄打開魔盒:初學者建議先使用手寫數字數據集MNIST或者衣服數據集Fashion-MNIST,圖片小,訓練速度快,能很快看到效果

內容轉換:

回覆帖子
內容:
用戶名: 您目前是匿名發表。
驗證碼:
看不清?換一張