如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
第142章 破壁挑战赛
隨著周昀在雷射笔上轻轻一按,巨幕上出现一副性能的对比图,正是之前给华为他们展示的那个。
所以除了台下的几位老总,其他都非常震惊,其中反应最大的就是英伟达的老黄。
“我知道,现在展示的一些数字可能会让大家觉得有些意外,但请相信,这是我们经过无数次测试、验证,反覆核对后的结果。“
雷射笔的红点落在了第一组柱状图上。
“首先,是在我们联盟伙伴,华为升腾910b平台上的表现。“
图表清晰地显示著针对一个超大规模transformer模型的训练耗时对比,“如各位所见,在相同的硬体条件下,v0.2版本完成训练的时间,仅为v0.1版本的58%。
”
台下响起一阵低低的吸气声,42%的效率提升,对於一个成熟架构的叠代版本来说,堪称恐怖。
但这还没完,周昀的声音提高了一些,红点移动到下一个对比项:“而相较於升腾平台原生的cann软体栈,v0.2將训练性能整体提升了40%!“
“哗——!”
台下再次传来阵阵惊呼,提升自家软体的性能或许可以理解,但竟然能大幅度超越晶片设计方自己优化的原生软体栈?
这合理吗?
“也许大家觉得这有些不可思议,但是这对aetos来说,確实是真实存在的,
这主要得益於v0.2版本对升腾晶片內部计算单元和內存带宽的极致利用,我们优化了一些尚未被充分探索的计算流水线特性,从而释放了更多的硬体潜力。
而在这个基础上,在一些特定的模型上,使用升腾910b运行aetosv0.2,其训练效率相较於在nvidiaa100上运行同等任务,提升了25%。“
a100,那可是英伟达在数据中心领域的標杆產品,在ai训练任务上被公开超越,这是破天荒的第一次!
虽然可能是在特定模型和特定优化下,但这象徵意义和实际威胁,足以引起震动。
台下,老黄眉头紧皱,他就知道,自己感觉没有错,这次aetos对他们带来的衝击绝对会是巨大的。
接下来周昀继续展示aetos在其他品牌的gpu上的性能,“接下来,是在海光gpgpu上,针对高解析度图像生成推理任务的测试,
v0.2的吞吐量达到了v0.1的3.2倍,能效比提升150%。“
这一次惊呼小了一些,对於v0.2的巨大提升,大家都有些习惯了:“同样,
在此推理任务上,其性能表现也优於在a100上的运行结果。“
隨后屏幕上显示了aetos在寒武纪等其他国內主流ai晶片上的测试数据,趋势几乎一致:
v0.2相较於v0.1和原生软体栈,都有巨大提升,並且在多项关键测试中,性能表现均超越了基於a100的对比平台。
“各位,aetosv0.2证明了一件事:通往更高算力的道路,不止一条,而选择权,现在正握在各位手中。“
说完,他笑著朝台下老黄的方向点了点头。
看著周昀这个意味深长的目光,老黄也朝他点了点头,不过心里却並不平静,虽然歷史上有很多cuda的挑战者,
但aetos是少有的能在初期就在一些方面超过cuda性能的產品,要说心里没压力肯定是不可能的。
本章未完,点击下一页继续阅读。