设置 | 登录 | 注册

chatgpt没有视力() [图片]

啊啊是谁都对 3-22 圆环之理 (点击/回复: 51/1)

自己练手训练的大模型在185700步生成的效果

仅仅100M的参数量(GPT-4的万分之一左右),目前还是base模型,没有包含chat功能。数据里包含轻小说,模型是学会了语言风格,当然仔细一看就是胡言乱语了。测试时使用"我喜欢你,"作为开...
悄悄打开魔盒 8-19 悄悄打开魔盒 (点击/回复: 358/8)

自己写了一遍GPT

难度还是不小的,有一些隐藏的坑
模型流程:
1. 文字序列首先被分成token,把token的序号输入模型, 输入张量的维数为(B,T), B是批次大小(也就是同时处理几段文字),T是文字...
悄悄打开魔盒 7-23 啊啊是谁都对 (点击/回复: 292/1)

文风测试

https://testurtext.site/
圆环之理 6-18 圆环之理 (点击/回复: 428/8)

@悄悄打开魔盒 对于这件事怎么看 [图片]

@悄悄打开魔盒
圆环之理 6-18 悄悄打开魔盒 (点击/回复: 252/1)

transformer和diffusion

目前的两个主流架构,分别处理离散和连续的数据,比如说语言和图像。
但是diffusion其实是训练方式,transformer是模型架构,所以diffusion也可以是transformer,D...
悄悄打开魔盒 6-17 悄悄打开魔盒 (点击/回复: 469/4)

许下心愿,我要实现强人工智能

悄悄打开魔盒 4-17 啊啊是谁都对 (点击/回复: 431/7)

您好,阿斯兰侃吧欢迎您的到来~

亲爱的用户:欢迎来到人工智能吧,阿斯兰侃吧欢迎您的到来~
请先阅读我们的社区准则:
https://zh.arslanbar.net/documents/eula/
以及版权...
社区管理员 3-4 社区管理员 (点击/回复: 271/0)
本吧共有主题数8个,帖子数38篇,会员0位。

内容转换:

发表帖子
标题:
内容:
用户名: 您目前是匿名发表。
验证码:
看不清?换一张
©2010-2025 Purasbar Ver3.0 [手机版] [桌面版]
除非另有声明,本站采用知识共享署名-相同方式共享 3.0 Unported许可协议进行许可。