如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。

第137章 v0.2

展示完v0.1的性能之后,v0.2才是真正的重磅炸弹。

“虽然vo.1的性能在各位看来已经很强了,但是我的目標始终都是超越cuda,所以在0.2版本中,我们对aetos的运行逻辑进行了优化,並且增加了一些重写过后的算子,相信我,这是一项真正能被称之为里程碑式的突破。“

周昀微微一笑,敲了一下键盘,一副柱状图被投影到白板上。

“aetosv0.2vs.v0.1&原生软体栈性能对比”

在图表的数据上有几个非常夸张的数字,几位老总第一眼看上去就是不相信。

在华为升腾910b上,针对一个超大规模transformer模型进行训练,v0.2版本的耗时仅为v0.1版本的58%,更是將升腾原生cann软体栈的性能提升了40%!

这都得益於v0.2对升腾晶片內部计算单元和內存带宽的极致利用,甚至自动发掘並优化了连华为自家工程师都尚未完全摸透的某种计算流水线特性,相较於相同模型在a100上的性能,提升了25%!

而在海光的一款gpgpu上,进行高解析度图像生成推理,vo.2的吞吐量达到了vo.1的3.2倍,能效比提升150%,也比在a100上的性能要好,还有寒武纪的,也差不多,反正提升都非常之大,而且比a100上运行的性能要好。

“这———这怎么可能?”在座的要说除了周昀之外谁对技术最为熟悉,那应该就是寒武纪的张博士。

所以他的反应也是最大的,在图片放出来的时候,他直接就站了起来,凑近屏幕,几乎要贴上去了。

“这种程度的优化,除非你们拿到了我们最底层的晶片设计文档!否则怎么可能比我们自己更了解如何发挥芯的极限?”

另外两位虽然不在科研一线了,但是对於数据中体现出来的技术,还是能看的出来的:“这也太夸张了,如果不是亲眼所见,我很难想像这是真实存在的。”

周昀看著大家的反应,就知道自己的目的已经达到了,隨后简单解释了一下v0.2能有如此大提升的原因。

“首先,我们並没有拿到在座任何一家公司的机密文件,能取得这样性能的原因和v0.2的核心有关,毫不夸张的说,这绝对是一项黑科技,我称之为硬体本能感知』的技术,简称hia。”

他切换幻灯片,展示了一个技术框架图。

“hia技术在v0.1的时候我们其实就已经做了一些尝试了,只是当时还不够成熟,只能做一些粗略的硬体特性探测,我们通过分析代码在目標硬体上的初步运行表现,来反推一些宏观的硬体参数,比如缓存大小、內存带宽的理论峰值等,然后进行一些相对基础的优化,这能带来不错的兼容性和基础性能,但远未触及硬体潜力的天花板。”

“而vo.2的hia技术,实现了质的飞跃,通过在程序运行的初始阶段,注入一系列精心设计的、极其微小的“探针』计算任务,这些探针』任务,其本身计算量可以忽略不计,但它们的设计目的,是精准地触发硬体內部各种可能存在的瓶颈或特性点,比如不同层级缓存之间的延迟差异、特定计算单元在不同数据模式下的吞吐量变化,、

本章未完,点击下一页继续阅读。

www.74txts.com
玄幻魔法小说相关阅读More+

推演,道成元始

佚名

清冷直男,被疯批皇帝强制爱了

佚名

天幕宝可梦:曝光小智弒神救世!

佚名

穿越菩提老祖,西游第一劫难

佚名

我有了透视眼之后,运气好到爆

佚名

开局青云宗主,召唤大帝境老祖

佚名