
chatgpt没有视力() [圖片]![]() |
自己练手训练的大模型在185700步生成的效果仅仅100M的参数量(GPT-4的万分之一左右),目前还是base模型,没有包含chat功能。数据里包含轻小说,模型是学会了语言风格,当然仔细一看就是胡言乱语了。测试时使用"我喜欢你,"作为开...
|
自己写了一遍GPT难度还是不小的,有一些隐藏的坑
模型流程: 1. 文字序列首先被分成token,把token的序号输入模型, 输入张量的维数为(B,T), B是批次大小(也就是同时处理几段文字),T是文字... |
文风测试https://testurtext.site/
|
@悄悄打开魔盒 对于这件事怎么看 [圖片]@悄悄打开魔盒
![]() |
transformer和diffusion目前的两个主流架构,分别处理离散和连续的数据,比如说语言和图像。
但是diffusion其实是训练方式,transformer是模型架构,所以diffusion也可以是transformer,D... |
许下心愿,我要实现强人工智能 |
您好,阿斯兰侃吧欢迎您的到来~亲爱的用户:欢迎来到人工智能吧,阿斯兰侃吧欢迎您的到来~
请先阅读我们的社区准则: https://zh.arslanbar.net/documents/eula/ 以及版权... |
本吧共有主題數8個,帖子數38篇,會員數0位。 |
內容轉換: |