目前共有5篇帖子。 內容轉換:不轉換▼
 
點擊 回復
77 4
transformer和diffusion
初級魔法師 四級
1樓 發表于:2024-4-4 01:26
目前的两个主流架构,分别处理离散和连续的数据,比如说语言和图像。

但是diffusion其实是训练方式,transformer是模型架构,所以diffusion也可以是transformer,DiT就是这样。

所以两个模型其实是可以融合的。


从transformer在长上下文的表现来看,已经可以有效处理1000万token,作为通用人工智能是合格的,但成本还是很高的,可能会限制其应用范围。

執行總編 二十一級
2樓 發表于:2024-4-4 08:33
感谢介绍人工智能的相关知识

能否介绍一下transformer的常用训练方式?

 
大魔法師 十一級
3樓 發表于:2024-4-4 09:30
 
執行總編 二十一級
4樓 發表于:2024-6-3 08:38
顺便一问,stable diffusion是不是其模型架构和训练方式都是diffusion?
 
悄悄打开魔盒:模型架构可以选择,sd 1.5和sdxl都是UNet,而sd3是transformer,训练方式是diffusion
  2024-6-17 19:43 回復

回復帖子

內容:
用戶名: 您目前是匿名發表
驗證碼:
(快捷鍵:Ctrl+Enter)
 

本帖信息

點擊數:77 回複數:4
評論數: ?
作者:悄悄打开魔盒
最後回復:悄悄打开魔盒
最後回復時間:2024-6-17 19:43
 
©2010-2024 Purasbar Ver2.0
除非另有聲明,本站採用創用CC姓名標示-相同方式分享 3.0 Unported許可協議進行許可。