吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

289次阅读
2 条评论

共计 896 个字符,预计需要花费 3 分钟才能阅读完成。

下一步是智能体?

随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么?

今天,人工智能著名学者、斯坦福大学教授吴恩达指出:AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁所有从事人工智能工作的人都关注 AI 智能体工作流,并撰写一篇博客简单阐述了原因。

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:

当前,我们主要在零样本模式下使用 LLM,提供 prompt,逐个 token 地生成最终输出,没有进行调整。

这类似于要求某人从头到尾写一篇文章,直接打字,不允许退格,并期望得到高质量的结果。尽管有困难,LLM 在这项任务上仍然表现得非常好!

然而,通过智能体工作流,我们可以要求 LLM 多次迭代文档。例如,它可能需要执行一系列步骤:

这个迭代过程对于大多数人类作家写出好的文本至关重要。对于人工智能来说,这种迭代工作流会比单次编写产生更好的结果。

Cognition AI 团队发布的 最近在社交媒体上引起了广泛关注。吴恩达的团队一直密切关注 AI 编写代码的发展,并分析了多个研究团队的结果,重点关注算法在广泛使用的 HumanEval 编码基准上的表现。

如下图所示,吴恩达的团队发现:GPT-3.5(零样本)的正确率为 48.1%,GPT-4(零样本)的表现更好,为 67.0%。然而,相比于迭代智能体工作流,从 GPT-3.5 到 GPT-4 的改进不大。事实上,在智能体循环(agent loop)中,GPT-3.5 的正确率高达 95.1%。

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

开源智能体工具和有关智能体的学术文献正在激增。这是一个令人兴奋的时刻,也是一个令人困惑的时刻。为了帮助人们正确看待这项工作,吴恩达分享了一个对构建智能体的设计模式进行分类的框架。

简单来说,这个框架包括:

吴恩达表示 AI Fund 已在许多应用程序中成功使用这些模式,后续他将详细阐述这些设计模式。

参考链接:

文章来源:https://www.jiqizhixin.com/articles/2024-03-22-3

正文完
 
yangyang
版权声明:本站原创文章,由 yangyang 2024-03-22发表,共计896字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(2 条评论)