
chatgpt沒有視力() [图片]![]() |
自己練手訓練的大模型在185700步生成的效果僅僅100M的參數量(GPT-4的萬分之一左右),目前還是base模型,沒有包含chat功能。數據里包含輕小說,模型是學會了語言風格,當然仔細一看就是胡言亂語了。測試時使用"我喜歡你,"作為開...
|
自己寫了一遍GPT難度還是不小的,有一些隱藏的坑
模型流程: 1. 文字序列首先被分成token,把token的序號輸入模型, 輸入張量的維數為(B,T), B是批次大小(也就是同時處理幾段文字),T是文字... |
文風測試https://testurtext.site/
|
@悄悄打開魔盒 對於這件事怎麼看 [图片]@悄悄打開魔盒
![]() |
transformer和diffusion目前的兩個主流架構,分別處理離散和連續的數據,比如說語言和圖像。
但是diffusion其實是訓練方式,transformer是模型架構,所以diffusion也可以是transformer,D... |
許下心願,我要實現強人工智慧 |
您好,阿斯蘭侃吧歡迎您的到來~親愛的用戶:歡迎來到人工智慧吧,阿斯蘭侃吧歡迎您的到來~
請先閱讀我們的社區準則: https://zh.arslanbar.net/documents/eula/ 以及版權... |
本吧共有主题数8个,帖子数38篇,会员数0位。 |
内容转换: |