如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
“咱们的项目偏应用层,就怕他来个底层的、硬核的指令集优化任务。”队友忧心忡忡。
“別自己嚇自己,组委会设置任务肯定会考虑多样性,赶紧去熟悉环境,检查工具链,別在基础问题上栽跟头。”
大会结束,人群开始隨著工作人员的指引,缓缓向会场外移动,前往不远处的“破壁者营地”生活区。
而在他们当中,有一支非常特殊的队伍。
一共四五个人,表面上看,他们註册地是新加坡一家名不见经传的研究机构,线上赛的表现稳健却不算特別亮眼,刚好卡在晋级线中游,並未引起太多注意。
但他们的背后其实是英伟达,这次的目的主要就是为了了解对手,有了上一次的教训,他们可不敢再小看aetos了。
他们的领队,化名“李维”的亚裔男子,看上去约莫四十岁,回到分配的宿舍,门一关上,团队氛围立刻变得不同,“艾伦,初步判断?”李维用的是英语,这是他们內部交流的习惯。
被点名的年轻技术专家,真名艾伦·米勒,立刻回应,语速很快:“李,和我们內部初步分析一致,但亲眼见到,感受更直观,aetosv0.2的架构设计,野心很大,他们试图用统一內存和强调极细粒度任务並行的模型,从根本上规避我们cuda在应对某些不规则负载时可能遇到的內存墙和调度开销,他们的编译器工具链完成度比我们预想的要高一些。”
另一位负责软体生態分析的队员,莎拉,补充道:“他们用巨额奖金和星火计划”这样的资源承诺,正在高效地构建开发者生態,这是一种非常聪明的做法,看看今天这些开发者的热情和素质,如果放任不管,aetos的生態可能会以超出我们预期的速度成长。”
李维瞥了她一眼:“这不是我们要关心的事情,我们来这里的任务只有一个,搜集对方的技术,至於其他的,不要乱来,明天任务公布之后,艾伦,你带领技术小组,首要目標是逆向分析aetos编译器与运行时库,他们的优化器在面对我们未知的复杂任务时,会做出何种决策?其生成的代码效率,与我们的nvcc相比,优劣具体在何处?特別是他们对不规则內存访问模式和任务依赖关係的处理,这是他们架构宣传的重点,也是我们需要验证的关键。
同时我们的成绩也不能太差,让我们儘可能地留在这里,这样我们才能儘可能多地了解aetos的整个系统。”
艾伦迅速点头:“明白,交给我吧。”
李维转向莎拉:“莎拉,你的重点在生態接口与兼容层,仔细观察他们提供的api、库函数以及任何可能与现有生態互通的工具,找出其中的缝隙、不完善的地方,但记住,只看,不碰,不留下任何痕跡,至於我,则是会重点关注系统级性能和能耗表现,利用任务压力,测试aetos
算力集群在持续高负载下的稳定性、散热以及功耗,这些硬体层面的真实数据,同样极具价值,总之,在我们的目的达到之前,儘量不要被发现,也不要被淘汰。”
翌日上午九点,主会场座无虚席。
经过一夜的休整,选手们脸上的疲惫稍减。
舞檯灯光再次亮起,昨晚那位干练的执行秘书长手持话筒走上台前。
“各位破壁者,早上好,欢迎来到破壁者营地”线下总决赛的第一个挑战日,我相信各位已经迫不及待了,和之前一样总决赛將分为三个平行赛道,以適应不同技术背景和专长的团队,与线上赛的自由发挥不同,线下总决赛的所有任务,均由联盟技术委员会精心设计,旨在全面检验各位在压力下的技术深度、广度与应变能力,第一阶段任务,现在公布!”
“【迁徙者】赛道,第一阶段任务:
迁移目標:一个基於cuda实现的非均匀快速傅立叶变换(non—uniformfft,nufft)核心库。”
该算法在科学计算、医学成像等领域应用广泛,其特点在於存在大量不规则的內存访问和非均匀的计算负载,极依赖cuda的线程层次结构和共享內存进行优化。
这个任务的难点在於,nufft在cuda上的极致性能,高度依赖於开发者手动管理共享內存(sharedmemory)来缓存数据、减少对全局內存的访问,而aetos的统一內存架构取消了这一显式层级,这是对他们原先解决问题的方法完全不同,而且cuda的线程块(threadblock)模型是一种相对粗粒度的並行单位,但是aetos倡导极细粒度任务並行,如何將nufft中复杂的插值计算分解成海量小任务,並確保aetos的硬体调度器能高效地处理这些任务之间的数据依赖,又是一个巨大的挑战。
“【超越者】赛道,第一阶段任务:
优化目標:一个千亿参数moe(mitureofeperts)模型的推理过程。该模型存在严重的负载不均衡问题,即不同“专家”网络被激活的频率和计算量差异巨大。
硬体平台:本阶段统一使用华为升腾910b晶片与aetosv0.2软体栈。”
这个任务的难点主要是在於千亿参数模型的权重本身就对內存系统构成巨大压力,同时,moe模型中的“门控网络”决策和专家结果匯总,会引入大量的通信操作,在aetos的架构下,如何优化模型切分、数据布局,以最小化通信量、最大化內存带宽利用,这些往往是看不见的细节。
“【造梦者】赛道,第一阶段任务:
创新方向:设计並实现一个面向非均衡时序数据”的预测或异常检测模型/
方法,数据特徵为:多变量、採样率不稳定、存在大量缺失值、且正常与异常模式边界模糊(模擬真实工业场景如设备监控、金融交易等)。”
这个任务除了需要选手基於aetos平台设计一种新的时序检测模型,还要求模型必须適应相对真实的环境,这绝对是一个非常大的挑战。
总之,这三个任务第一眼看上去可能並不觉得太难,但是当真正上手做的时候,才会发现各种各样解决不了的问题,这也是这次比赛的意义所在。
而且这三个任务,分別从“生態迁移”、“系统优化”和“原生创新”三个维度出发,足以见得aetos联盟的野心。
本章未完,点击下一页继续阅读。