
yangyang
文章 934
AI智慧秀 同时操控手机和电脑,100项任务,跨系统智能体评测基准有了
AI 智能体(Agent)是当下大型语言模型社区中最为吸引人的研究方向之一,用户只需要提出自己的需求,智能体框架便可以调度多个 LLMs 并支持多智能体(Multi-
AI智慧秀 一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企「炒作」AgentQ
当炒作出了「泼天的流量」,已经没人关心产品厉不厉害了。
AI智慧秀 OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?
有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。
热门文章

深度剖析 Google AI 眼镜战略:「百镜大战」没来,但谷歌想用 Gemini「再次伟大」
戴上 Gemini 很美好,做出这副眼镜太不易。

谷歌发布 1800 元/月的 AI 订阅,还把「通用 AI」塞进了生态每个角落
软件硬件双管齐下,定义「下一代 AI 产品」怎么做。

中国 AI 大厂,被 Deepseek 掀了牌桌之后
当技术范式重构,强者也不得不重新起跑。

测评 | 从实验室到茶水间,可量产万元全尺寸具身机器人全网首测
万元级机器人要来了,下一站可能就是你家楼下商场。

Anthropic「切断」Windsurf,AI Coding 成 AI 巨头「代理人之战」
当氛围编程成为巨头最眼馋的市场,AI Coding 创业者们可能会被逼站队。