“它的计算图编译、算子调度、显存管理,全部走九章底层的API。”
“离开九章,TenSOrFlOW连一行代码都跑不起来。”
“所以我们的显卡……”老黄的声音沉下来。
“完全跑不了。”德里克没有绕弯子,“不是效率低,是根本跑不了。”
“TenSOrFlOW的底层调用全部绑定九章平台的接口,九章又绑定了AMD的GPU指令集。”
“我们的显卡对这套体系来说,就是一堆废铁。”
“如果要让英伟达显卡跑TenSOrFlOW,只有一个办法——先接入九章生态,我们的硬件根据九章的要求来做兼容。”
老黄没说话,手指压在桌沿上,指节发白。
德里克继续往下说,语速不自觉地放慢了半拍:“如果不想接入九章,要在CUDA上做一套类似TenSOrFlOW的技术体系,我们的团队评估过了——至少一年半。”
“这是保守估计。底层需要重做计算图自动微分引擎、混合精度编译器、跨卡显存池管理,还得把整个算子库重新封装一层对开发者友好的PythOn接口。”
“这东西不是拼积木,是系统工程。”
The content is not finished, continue reading on the next page