第171章 我需要当面和他谈谈
如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
……
然而,震惊过后,朱宋纯的理性开始捕捉到这种算法的缺点。
“不对……这玩意儿,现在的硬体根本跑不动。”
朱宋纯重新坐回椅子上,指关节有节奏地敲击著桌面,大脑开始飞速进行工程评估。
“目前的gpu,无论是英伟达的h100还是国產的昇腾910,其底层架构的设计哲学只有一个——为『矩阵乘法』极致优化。它们擅长的是大规模、並行的线性运算。”
“但徐辰这个slrm架构……”
他盯著论文里那些复杂的几何公式:“大量的非线性几何交集运算、复杂的拓扑变换、频繁的条件判断……”
“这在gpu看来,就是最討厌的『分支预测』和『標量计算』。如果强行用cuda架构跑这个算法,h100的几千个核心大部分时间都会处於『等待』状態,利用率恐怕连5%都不到!”
“这简直是用法拉利的引擎去拉磨,不仅慢,而且极度浪费!”
“而且,cpu也不行,核心数太少,吞吐量不够。”
朱宋纯嘆了口气,眼神中透出一丝无奈。
“工程上是灾难级的。要想產业化,必须重写底层的算子库,甚至……需要专门设计一种新的晶片架构——逻辑处理单元(lpu)。”
“不过,至少从理论上证明了这条路是通的。”
朱宋纯站起身,走到窗前,望著窗外正在建设的计算中心,思绪飘回了七年前。
“2017年,当transformer架构刚横空出世时,情况比现在好不了多少。那时候,推理一个简单的翻译任务,成本高达每百万token 100美元,慢得像蜗牛。”
“后来,產业界花了整整五年。通过flashattention优化显存读写,通过kv cache加速推理,通过量化技术压缩模型……硬生生把推理成本降到了现在的0.01美元,降幅高达99.99%!”
“正是这无数工程师堆出来的工程奇蹟,才造就了chatgpt的爆发。”
朱宋纯回过头,目光重新落在屏幕上。
“如今,徐辰这个slrm,就像是当年的transformer。”
“虽然现在的ai產业链已经比几年前成熟太多,工具链也更完善,要想把这个『数学模型』打磨成『商业產品』,速度会快很多。”
“但即便如此,按照正常的市场规律,从晶片设计到流片,从算子优化到框架適配,至少也需要18个月到2年的时间,才能拿出成熟的產品。”
“两年……”
朱宋纯眉头紧锁。
“太久了。在ai这个日新月异的领域,两年足够发生三次技术叠代了。”
但隨即,他的眼中闪过一丝决绝的光芒。
“如果……动用国家力量呢?”
“如果我们集中海思、寒武纪的晶片设计能力,集中工程优化团队,集中全国的算力资源,搞一次『大兵团作战』呢?”
“也许,我们可以把这个时间,压缩到半年!”
“这是一个千载难逢的『弯道超车』机会。”
“这是一场豪赌。”
“一旦输了,几十亿的投入打水漂。”
“但一旦贏了……”
朱宋纯猛地握紧了拳头,指甲深深陷入掌心。
“我们將彻底摆脱对英伟达cuda生態的依赖,建立起一套由中国人定义的、全新的ai底层標准!”
“从跟隨者,变成领跑者。”
“这个赌注,值得下!必须下!”
想到这里,朱宋纯不再犹豫。
……
他抬起头,目光扫过办公室里的几个博士生。
那种眼神,锐利得让人不敢直视。
“你们几个。”朱宋纯的声音低沉而严肃,“先出去。”
“啊?”博士生们愣了一下。
“把门带上。没有我的允许,谁也不许进来。”朱宋纯加重了语气,“还有,今天你们在这里看到的一切,哪怕是一个標点符號,都不许往外说。听明白了吗?”
“听……听明白了!”
几个博士生嚇得一激灵,连忙收拾东西,逃也似地离开了办公室。
走廊里,几个博士生面面相覷,一脸的委屈和茫然。
大家交换了一个眼神,內心疯狂吐槽:
【不是……老板这是受啥刺激了?】
【还“看到的一切,不许往外说”?冤枉啊!我们看啥了?】
【我们就看见您对著个电脑屏幕,一会儿拍桌子狂笑,一会儿站起来转圈,跟练走火入魔了似的……】
【这让我们泄露啥?泄露“震惊!某知名ai大牛疑似更年期综合徵发作,办公室独自唱跳rap”?】
虽然心里吐槽归吐槽,但他们谁也不敢多逗留一秒,赶紧溜之大吉。
……
办公室內,终於清静了。
朱宋纯深吸了一口气,颤抖著手,拿起了桌上的电话,直接拨通了张伟平的號码。
“喂,老张!你那个学生……徐辰!他现在在哪儿?!”
“老张,你赶紧联繫他,让他如果有空的话,务必来我办公室一趟!”
“有些事,我需要当面和他谈谈!”
本章未完,点击下一页继续阅读。