AI智慧秀 多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」 最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 – 动作序列)的新序列