圖像生成模型訓練實驗_人工智慧吧

目前共有4篇帖子。

1樓悄悄打开魔盒 2026-2-24 20:53

首先訓練了VAE作為圖像壓縮模型，然後訓練DiT作為圖像生成模型

目前還只訓練了imagenet，一百多萬張圖，1000類，類別標籤生圖，後續考慮加上文本生圖

2樓悄悄打开魔盒 2026-2-24 20:56

150000步採樣（batchsize=32,按照這個計算，全數據集每張圖已經過了四遍）：

悄悄打开魔盒：單張3090訓練速度非常有限，一小時只有一萬步左右，所以到現在還看不出來什麼穩定的圖像

悄悄打开魔盒：回復 @悄悄打開魔盒：初學者建議先使用手寫數字數據集MNIST或者衣服數據集Fashion-MNIST，圖片小，訓練速度快，能很快看到效果

[查看詳情]