第594章 性能碾压CUDA?
德里克盯著面前的显示器,双手离开键盘,重重地搓了搓脸颊。
他是cuda生態核心开发团队的资深工程师,平时自詡为硅谷的“肝帝”。
但此时此刻,他觉得自己引以为傲的肝,大概是需要报废了。
“亚瑟,你確定硬体没插错吗?”德里克转头,看著旁边顶著两个黑眼圈的助理工程师。
亚瑟打了个大大的哈欠,抓起桌上的功能饮料灌了一口。
“老大,这已经是你今晚第八次问我这个问题了。”
亚瑟指了指玻璃机房里那台全速运转的测试机。
“里面插著四张amd的顶级显卡,主板是全新的,连供电线都是我亲手接的。”
德里克咬著牙,指著屏幕上正在跑的代码终端。
“那你能给我解释一下,为什么这套叫『九章』的玩意儿,跑我们的矩阵乘法测试用例,速度比咱们自家的卡配合cuda还要快百分之十二?”
亚瑟摊了摊手,脸上写满了“我也很绝望”。
“不仅是矩阵乘法,刚才跑的快速傅立叶变换,它领先了百分之十五。”
德里克猛地站起身,绕著工位走了两圈,伸手抓了抓本就稀疏的头髮。
“这完全不讲基本法啊!amd的硬体架构什么德行我们最清楚。”
“他们那套驱动烂得连他们自己人都头疼,怎么可能榨出这种级別的算力?”
亚瑟滑动滑鼠,將一份底层调度日誌拖到主屏幕上。
“老大,问题就出在这儿。九章根本没用amd的官方驱动逻辑。”
“他们估计重写了底层,直接绕过了那些臃肿的冗余代码,直接对显存和流处理器进行微操。”
德里克凑近屏幕,盯著那些跳动的十六进位地址和调度线程。
一行行看下去,他的呼吸越来越重。
这代码写得太妖孽了。
没有任何多余的指令,每一级缓存的命中率被计算到了极致。
这种感觉,就像是有人开著一辆破旧的二手皮卡,在赛道上套了他们f1赛车的圈。
关键是,对方的车技毫无破绽。
“这帮中国人是怪物吗?”德里克跌坐回椅子上,感觉血压直线飆升。
“盛夏科技……我连听都没听过这家公司,他们哪来这么多懂底层硬体的神仙?”
亚瑟摇摇头,敲击键盘调出另一份数据。
“也並非全方位碾压,我们加班加点测了三十四个核心模块,还是贏了两项的。”
德里克眼睛一亮,仿佛抓住了救命稻草。
“哪两项?快说!”
“一个是针对早期单精度浮点运算的某个特定物理引擎的兼容性测试。”
亚瑟看著屏幕,语气毫无波澜。
“还有一个是极少数非標格式的视频解码渲染。”
德里克刚刚燃起的希望瞬间熄灭。
“这有个屁用!这都是边缘得不能再边缘的功能,下个版本我们自己都要弃用的东西!”
亚瑟嘆了口气,点击滑鼠,將一份文档拖了出来。
“老大,还有一个更让人破防的消息,你要不要听?”
德里克按住胸口,深吸了一口气。
“说吧,我的心臟承受得住。”
亚瑟將文档全屏,指著上面一段英文翻译。
“这是九章计算平台官网的开发者文档说明。”
“上面写著:当前版本仅为单节点预览版。”