如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
第129章 aetos
“启智』的试验还在继续,期间也不用周昀每天盯著,不过他也不会閒著。
虽然只有他和陈默两个人,但也还是在九月底的时候完成了第一个版本的aetos,aetos就是周昀计划替代cuda的生態。
当然,现在还远远做不到cuda那样强大。
在陈默完成了矩阵运算的tiie分割的攻克之后,vo.1版本的aetos就有了最为趁手的解决工具。
而在进行了一系列的算子重写之后,aetos可以实现让一些非英伟达的显卡做到与之相同的矩阵运算速度。
但毕竟只是两个人做的,功能非常少,现如今能做到的只有一些核心基础算子,比如relu、sigmoid、tanh等激活函数,以及加法、乘法.
还有求和、求最大值,矩阵转置,不过最为核心的还是gemm,也就是通用矩阵乘法,而gemm是深度学习、科学计算等领域的绝对计算核心。
掌握了它就代表他们完成了从零到一的突破。
为此他们还专门写了一个专用的编译器,能將某种形式的计算描述转换成高度优化的gpu的机器代码,而这个机器代码可以適配不同的gpu核心,比如amd,英特尔,还有国產的。
简单来说,通过aetos,可以实现在amd平台上训练出一个简单的深度学习模型,例如轻量级的cnn、lstm、dnn等等。
这在以前是很难想像的,最重要的就是其运算速度可以接近甚至持平在同级別n卡上用cuda跑的效果,这都是tie分割所带来的效果,让其足以弥补硬体上的差距。
除了这些优点,缺点自然也是有的,比如他现在还无法直接运行为cuda编写的现有代码,还无法兼容pytorch、tensorfiow等主流框架,同时也缺少cuda提供的成千上万个高度优化的库,如cudnn,cublas,cufft,缺乏nvidiansight那样强大的性能分析、调试工具,而且现在的aetos优化主要集中在ai和线性代数计算上,对图形、物理模擬等其他通用计算任务的支持非常有限或尚未开发。
而且哪怕是坐到了这种程度,就算工程师们知道你的东西是自己,勉强能用,但也不会捨弃已经非常成熟的cuda,除非是玄武』这种国家级別的项目,为了做到完全自研,才会去做这种费力不討好的事情。
这也能看的出来,想要构建一个完整的生態是多么的困难。
而此时,正是aetos在大眾面前的第一次亮相。
因为之前参加了玄武』项目,周昀在接下来的几年之內都不能出国,neurips之类的会议他自然是没法去了,国外的主会场去不了,国內的neurips线下论文分享会却是邀请了周昀。
周昀作为一个年轻学者,在neurips连续发表六篇论文,並且每一篇质量都极高,自然会引起学术圈的注意。
他也答应了,他正愁著该怎么宣传aetos,一个良好的技术生態或者是平台,开源永远都是叠代最快的方式。
而所谓neurips线下论文分享会,主要是为了国內人工智慧领域的学者、研究人员、
本章未完,点击下一页继续阅读。