AI智慧秀 天下苦英伟达久矣!PyTorch官方免CUDA加速推理,Triton时代要来? 近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。