
yangyang
文章 934
AI智慧秀 多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 – 动作序列)的新序列
AI智慧秀 物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野
如何突破 Transformer 的 Attention 机制?中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。
AI智慧秀 药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊
研究人员表示,术语「linker」泛指任何能够连接起始分子片段的化学物质,并不特指与所讨论任一领域相关术语的特定含义。
AI智慧秀 李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2
如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。
AI智慧秀 模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收
现今,机器学习(ML),更具体地说,深度学习已经改变了从金融到医疗等广泛的行业。
AI智慧秀 DeepMind升级Transformer,前向通过FLOPs最多可降一半
引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。
热门文章

深度剖析 Google AI 眼镜战略:「百镜大战」没来,但谷歌想用 Gemini「再次伟大」
戴上 Gemini 很美好,做出这副眼镜太不易。

测评 | 从实验室到茶水间,可量产万元全尺寸具身机器人全网首测
万元级机器人要来了,下一站可能就是你家楼下商场。

腾讯 AI「登陆战」
从「造模型」到「用好模型」,腾讯想做 AI 落地的那双手

中国 AI 大厂,被 Deepseek 掀了牌桌之后
当技术范式重构,强者也不得不重新起跑。

Anthropic「切断」Windsurf,AI Coding 成 AI 巨头「代理人之战」
当氛围编程成为巨头最眼馋的市场,AI Coding 创业者们可能会被逼站队。