AI智慧秀 如何应对Transformer的计算局限?思维链推理提高神经网络计算 随着基于 Transformer 的模型不断发展,某些任务继续给它们带来麻烦,一些研究人员开始怀疑,推动更可并行化的模型是否需要付出代价。