免费阅读
返回
菜单
上一章查看最新章节下一章

437. 傲慢的代价

作品:重生之AI教父作者:CloseAI
如果本章错误,请点击报错10秒纠正

直接支持这一功能。

长期居于龙头位置的closeai程序员们并没有选择下苦工用其他的方式实现这一功能,而是选择了与英伟达沟通,以求让英伟达在下代硬件框架中支持细粒度缩放格式。

孟繁岐回忆起那个时候,欲言又止。

这称得上是错误吗?其实也不见得。

因为closeai的建议为英伟达提供了重要参考。

下一代硬件框架中支持该功能无疑是非常正确的决定。

但...没有它真的就做不了吗?很显然,DS回答了这个问题,现有的条件之下,技术并不是无法实现的。

另一件让孟繁岐感到扼腕叹息的事情,是双方在“稀疏”这一概念上的分歧。

在FP8问题上,孟繁岐与DS是一致的。

在稀疏这一方向上,孟繁岐选择了细粒度,矩阵层面的稀疏。

DS则选择了通道层面的MoE,混合专家模型。

简单来说,DS选择把模型拆分为16/32个专家,就像是把一块蛋糕均分切成16/32块。

每一块都是不同的味道,每一个专家更加专注于不同的知识。

根据具体的情况,会有一个门控系统,来决定哪些专家参与计算。

而孟繁岐的野心更甚,他想要从根本上将整个模型在原子级别拆分,细粒度地对所有权重进行大刀阔斧地裁减,直到原本大小的16/32分之一。

从理论上说,这种方式的上限更高,MoE的稀疏更显得粗糙。

另一方面,孟繁岐也有愿景,想要增强国内硬件的竞争力。

因为英伟达的设备,是无法支持这种细粒度稀疏计算的。

倘若能够先发展国内计算设备,适配这种技术,就能够在制程等诸多硬件技术落后的情况下,达到更快的推理效果。

换言之,孟繁岐又一次将希望寄予了发展周期更长的硬件厂商,那么在这方面被其他人赶上,倒也不是什么奇怪的事情了。

虽然具体实现上稍显不同,但总体来说,DS完成了孟繁岐在技术上的两点宏观展望。

从其余的许多技术细节当中,孟繁岐可以很强烈地读到,他们的开发之路走得也并不顺利。

比如说混合专家MoE,很容易让一两个专家变成懂王,什么都要参与,很多其他的专家渐渐变成了挂件,貌似在参与,其实完全就是围观的观众。

如果增加额外的损失

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【苍穹小说】 m.cqgeyin.net。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看最新章节下一章
临时书架加入书签回顶部↑

看了《重生之AI教父》的书友还喜欢看

公路求生,开玩具车也能当榜一?
作者:老酒抽到上上签
简介: 【公路求生?无CP?微群像】一睁眼,花浅穿着睡衣抱着猫,被丢进了公路求生游戏。
更新时间:2026-03-03 23:16:00
最新章节:第九十四章预知
牛啊牛啊!男主们又被抢走了
作者:岁也
简介: 【快穿渣女万人迷+修罗场+顶级勾引+黑原女主+无固定cp】\n桑雪是一个坏女人,死后...
更新时间:2026-03-03 23:43:44
最新章节:他太优秀了怎么办?13
重生在星际选择成为药剂师
作者:长尾兔子
简介: 陈房子年纪轻轻便猝死了,死前啥都没有,没有房子没有存款没有恋人,浑身散发着满满的社畜...
更新时间:2026-03-03 23:39:08
最新章节:732 反正早上已经看过了,再洗洗也无所谓了
诸天:开局拐走雄霸之女幽若
作者:一个大兵55
简介: 觉醒穿越诸天的超能力,空降风云世界湖心小筑,开局被幽若用剑指着脖子。
更新时间:2026-03-03 23:30:23
最新章节:第197章指点灵感大王,得《黑水诀》
重生八零,苏小姐杀疯了
作者:倾城五儿
简介: 苏瑶死前才知道,自己一辈子未婚。她被江家骗了一辈子,为江家奉献了自己的一辈子。
更新时间:2026-03-03 23:27:00
最新章节:第175章 离了
家父刘备,望父成龙
作者:周府
简介: 汉室衰弱,群雄逐鹿。徐州陶谦、兖州曹操、扬州袁术,窥探中原。刘公初居小沛,深陷纷争,...
更新时间:2026-03-03 22:54:19
最新章节:第24章我胜则曹忧,我败则曹喜
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 苍穹小说 All Rights Reserved.kk

SiteMap