如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。

掛断电话后,朱宋纯並没有坐回办公桌前。

他走到巨大的落地窗边,脑海中预演完这场即將到来的风暴。

“slrm……”

朱宋纯在心中默念著这个缩写。

作为一个在ai领域摸爬滚打三十年的老兵,他太清楚一项新技术从实验室走到產业链,中间隔著多少道鬼门关。

资源是有限的,时间是紧迫的。要想在镁国人的眼皮子底下完成“换道超车”,必须要有精密的战术编排,形成不可逆转的“飞轮效应”。

“第一步,必须是晶片。”

朱宋纯目光一凛。他当然知道“硬体彩票”理论——通常是硬体决定了哪种算法能活下来,而不是反过来。为一个新算法定製晶片是一场豪赌,贏了通吃,输了倾家荡產。

但在slrm面前,这註定是一场值得押上身家性命的赌局。因为这可能是目前华国ai唯一一次掀翻桌子的机会。

“软体优化是有极限的。在gpu架构上跑逻辑推理,就像是在沙地上跑f1赛车。gpu的数千个cuda核心是为矩阵乘法这种『大吞吐、低逻辑』的任务设计的。而slrm的核心是『gumbel-box』,充满了条件判断和非线性变换。”

“如果不解决底层硬体的適配问题,slrm永远只能是个『慢吞吞』的数学玩具。”

“所以,必须由国家队进场。海思、寒武纪,必须在下一代晶片的ip核中,硬化『gumbel-box』算子,设计专用的lpu(逻辑处理单元)。”

专业计算卡相比通用卡的优势是巨大的。当年比特幣挖矿,一开始大家也用显卡。但后来比特大陆搞出了专用asic晶片,能效比直接提升了百倍,瞬间把显卡扫出了挖矿市场。

“slrm也是一样的道理。它对製程不敏感,不需要追求台积电的3nm、5nm极致工艺。哪怕是用国內成熟的14nm甚至28nm工艺,只要架构对了,去掉了gpu里那些为了图形渲染而存在的冗余单元,专攻逻辑推理运算,其能效比也能吊打英伟达的4nm h100。”

“这一步最慢,流片周期至少三个月,所以必须最先启动,作为『矛尖』。”

……

“第二步,是生態的『躯干』——编译器与中间表达(ir)。”

朱宋纯的思绪转向了软体层。

“光有晶片还不够,得让开发者用得爽。”

“英伟达的护城河不仅仅是硬体,更是cuda。那个庞大的算子库,让无数开发者產生了路径依赖。但cuda是为矩阵计算生的,在逻辑推理的新赛道上,它也是个瘸子。”

“我们要定义新的標准。可以让华威的mindspore团队,开发一套专门针对slrm的编译器后端。”

“虽然最终的编译器后端依赖於晶片的指令集,但中间层的框架设计现在就可以启动。我们要打造一套专门针对slrm原生优化的软体栈,让开发者能像呼吸一样自然地迁移过来。”

……

“第三步,才是应用落地。”

“我们需要一个『杀手级』的demo,来点燃资本的热情。”

“比如法律大模型,或者数学解题大模型。用极小的参数量,实现极高的准確率。”

想到这里,朱宋纯停顿了一下,並没有被狂热冲昏头脑。他很清楚,成本优势的建立不是一夜之间的事。

“transformer架构的推理成本从每百万token 100美元降到0.01美元,用了整整八年。slrm作为新生事物,初期的单位算力成本必然高昂,不可能一上来就比成熟的gpu更便宜。”

“但这局棋依然能活。”

“关键在於『共生』。slrm与llm结合,能產生『一加一大於二』的化学反应。因此这个组合中的llm可以用小参数模型,成本会降低。用昂贵但精明的slrm做逻辑引导,用廉价且量大的传统llm做知识填充。只要总体方案能对標同等智力的大参数模型,商业闭环就能跑通。我们不需要等八年,现在就能上牌桌。”

本章未完,点击下一页继续阅读。

www.74txts.com
玄幻魔法小说相关阅读More+

上交游戏界,国家给我氪成破解版

佚名

狐妖:开局韩天尊,雅雅想刀我?

佚名

傻小子,你大胆一点

佚名