AI搞科研?西湖大学发布「AI科学家」Nova,效果比SOTA竞品提升2.5倍

330次阅读
没有评论

共计 2730 个字符,预计需要花费 7 分钟才能阅读完成。

为了验证「Nova大模型」的能力,研究团队进行了一系列测试,将得到的结果拿给身边的科学家看,他们都不敢相信这是AI创作的。

让我们通过几个具体的例子来进一步了解「Nova 大模型」是如何工作的。

例 1:癌症治疗研究者

提示词:假设你是一位致力于癌症治疗研究的科学家,正试图寻找一种新的治疗手段。你将一篇关于免疫疗法的论文输入 Nova 系统作为种子。Nova 随即生成了一些初步的想法,比如「结合 CRISPR 基因编辑技术和 CAR-T 细胞疗法,针对肿瘤微环境中的特定免疫抑制因子。」

接下来,Nova 通过迭代规划和检索机制,进一步细化和完善这些初步的概念。在这个过程中,Nova 不仅查阅了最新的研究进展,还借鉴了其他相关领域的知识,如纳米技术、蛋白质工程等。

最终,它形成了一个详细且创新的研究计划。这个计划不仅包括了理论上的设想,还包含了具体的实验步骤和预期的结果分析,使得研究者可以轻松地将想法转化为实际操作。

例 2:人工智能教育技术开发者

提示词:再假设你是一位专注于人工智能教育技术的研发者,你希望开发一种能够个性化教学的人工智能系统。你将一篇关于自适应学习算法的论文输入 Nova 系统作为种子。

Nova 随即生成了一些初步的想法,比如「结合情感计算与自适应学习算法,开发一种能够感知学生情绪状态并相应调整教学策略的人工智能系统。」

Nova 会进一步细化和完善这些初步概念,比如引入情感计算技术来识别学生的情绪变化,并据此调整教学节奏和内容,使得教学更加个性化和有效。通过这样的迭代过程,最终形成一个既具有创新性又可行的研究方案。

通过这样的方法,Nova 不仅帮助科学家们找到了新的研究方向,还在教育技术领域发挥了重要作用。个性化的教学系统能够根据每个学生的具体情况调整教学策略,这对于提高教育质量和促进教育公平具有重要意义。

例 3:环境科学研究员

提示词:假设你是一位环境科学研究员,致力于开发新的可持续能源解决方案。你将一篇关于太阳能电池效率提升的论文输入 Nova 系统作为种子。

Nova 随即生成了一些初步的想法,比如「利用石墨烯增强太阳能电池的光电转换效率。」

接下来,Nova 通过检索最新的材料科学文献,进一步细化和完善这些初步的概念。比如,结合石墨烯的导电特性与太阳能电池的光电转换机理,设计一种新的太阳能电池结构。最终,形成一个既有科学依据又具有实用性的研究计划。

初心:为什么要研究「Nova 大模型」?

「我身边的科学家,包括我自己做科研这么多年了,有一个特别明显的感受,就是我们虽然做着最前沿的最具探索性的事情,但实际组织工作的方式却是非常传统的,甚至像是手工作坊。」蓝振忠说。

让我们来看一个科研工作者的一天是如何构成的。到了办公室,打开电脑开始看 paper,如果有了新的 idea 会记录下来,查阅相关资料,看是否有人已经在做这个方向。深度阅读 1-2 篇 paper,一上午就过去了。下午,开组会,讨论上午想出来的 idea,与团队一起头脑风暴,探讨可行性。

这一天的效率已经够高了,但是这样的工作模式可能远跟不上有价值的 paper 的产生速度。况且,接下来有很多伟大的创新会诞生于跨学科领域,Idea 的产生同样受到科学家学科背景、过往经验的限制。

如果我们有一个 AI 模型,可以帮助科学家提升效率,那科研的进展会不会突发猛进?

有了 Nova 大模型后,科研工作者的一天可能会这样度过。大模型可以迅速阅读最新的 Paper,帮助科研工作者提取其中的关键信息,根据提取的信息,生成多个高质量的 idea。涉及到跨领域的知识,大模型也可以轻松完成。人类科学家只需要根据模型生成的内容进行判断,大大节省了科研的时间,提升了科研的效率。

不仅如此,科研所需的创新能力,也正是模型擅长的。「不断找到最有价值的科研的方向很难,我们就是要尝试打破现状,所以打造了 Nova 大模型。科学家个体的能力固然强,我们更希望用 AI 模型『杠杆』科学家的科研能力,加速人类科学的进步。」作为团队负责人,蓝振忠充满信心。

十足的信心来源于对规律的把握和前景的判断。蓝振忠坦言:「接下来有很多伟大的创新会是跨学科的,比如今年诺贝尔奖颁发给了 AI 交叉领域的科学家,也是对AI跨学科成就的一种肯定。但是,科学家个人终其一生顶多成为1-2个领域的专家,所以单靠个人能力,做跨学科颠覆式创新是非常困难的。但这件事天然适合大模型来做。我们打算让模型成为各个领域最懂创新的专家,希望它能够产生人类科研结果中最重要、最稀缺的『跨学科式创新』。」

此外,全球一年的科研经费(以2022年为例)接近2.5万亿美元,我们的模型哪怕只是「替代」了部分科研人员的能力,带来的价值也是不可估量的。

「因此,提升科研效率、节约资源、为国家科技创新贡献力量,就是我们研发『Nova大模型』的初心。」蓝振忠认为。

难题:训练 Nova,需要克服什么困难?

我们借鉴了生物进化里面的演进原理,idea 的迭代就像生物进化,一代一代的演进与选择。

「做这件事情是真的很难。」蓝振忠坦言。要让模型像人类一样思考,懂得人类是如何创新的,并把这种思考方式抽象成算法和模型的架构,真的做了才知道有多难。

简单来说,整个模型的创新过程很像人类。

首先我们把人类各种创新方法论融合到模型的推理过程中。然后让模型基于这些验证过的方法论、创新路径来产生一批 idea。这些 idea 对于我们整个模型来说,只是第一步,它们被称为 seed idea (gen_0)。

这些 seed idea 其实只是模型自我推进创新的开始。模型基于这些 seed idea 会进一步去主动学习搜索各种各样的资料,动态选择新的创新方法论,进而生成下一波更创新的idea(gen_1, gen_2, gen_3 …), 持续迭代,不断进步—— 这是一种持续 「探索-学习-进步」 的自我进化算法原理。

验证:Nova 大模型采用了什么样的自动化、人工评估过程?

研究团队在质量、多样性、新颖性三个方面对 Nova 模型进行全面的自动化评估。

1)质量:采用专业的评测方法,将 4 个不同方法生成的 idea 按照瑞士轮方法一起进行打分,Nova 产生的 619 个想法和 2521 个想法分别获得了 4 分和 5 分,大大超越了其他基线方法。

AI搞科研?西湖大学发布「AI科学家」Nova,效果比SOTA竞品提升2.5倍

图示:瑞士制排名赛不同方法的得分分布。(来源:论文)

2)多样性:大模型生成 idea 重复度比较高是当前面临的主要问题之一。研究团队通过计算 idea 之间的相似度来对生成的 idea 进行去重。可以看出,随着生成的想法数量的增加,Nova 模型可以通过迭代规划和搜索不断产生新的想法。在非重复百分比方面,Nova 的表现明显优于其他产品,超过 80% 的想法都是独一无二的。

AI搞科研?西湖大学发布「AI科学家」Nova,效果比SOTA竞品提升2.5倍

文章来源:https://www.jiqizhixin.com/articles/2024-10-24-4

正文完
 
yangyang
版权声明:本站原创文章,由 yangyang 2024-10-24发表,共计2730字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)