設置 | 登錄 | 註冊

目前共有5篇帖子。

transformer和diffusion

1樓 悄悄打开魔盒 2024-4-4 01:26
目前的两个主流架构,分别处理离散和连续的数据,比如说语言和图像。

但是diffusion其实是训练方式,transformer是模型架构,所以diffusion也可以是transformer,DiT就是这样。

所以两个模型其实是可以融合的。


从transformer在长上下文的表现来看,已经可以有效处理1000万token,作为通用人工智能是合格的,但成本还是很高的,可能会限制其应用范围。

2樓 啊啊是谁都对 2024-4-4 08:33
感谢介绍人工智能的相关知识

能否介绍一下transformer的常用训练方式?

3樓 圆环之理 2024-4-4 09:30
4樓 啊啊是谁都对 2024-6-3 08:38
顺便一问,stable diffusion是不是其模型架构和训练方式都是diffusion?
悄悄打开魔盒模型架构可以选择,sd 1.5和sdxl都是UNet,而sd3是transformer,训练方式是diffusion

內容轉換:

回覆帖子
內容:
用戶名: 您目前是匿名發表。
驗證碼:
看不清?換一張
©2010-2025 Purasbar Ver3.0 [手機版] [桌面版]
除非另有聲明,本站採用知識共享署名-相同方式共享 3.0 Unported許可協議進行許可。