自动化机器学习研究MLR-Copilot：利用大型语言模型进行研究加速

439次阅读

共计 1719 个字符，预计需要花费 5 分钟才能阅读完成。

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

该论文的第一作者及指导作者均来自德克萨斯大学达拉斯分校，第一作者为博士生 Ruochen Li，指导作者为其博士生导师 Xinya Du，专注于自然语言处理、深度学习和大语言模型的研究。Xinya Du 的工作发表在包括 ACL、EMNLP 和 ICLR 在内的顶级自然语言处理和机器学习会议上，其问题生成工作入选最具影响力的 ACL 论文。他被评为数据科学领域的闪亮新星，并获得了 2024 年的 NSF CAREER 奖项和 WAIC 云帆奖。

科学技术的快速发展过程中，机器学习研究作为创新的核心驱动力，面临着实验过程复杂、耗时且易出错，研究进展缓慢以及对专门知识需求高的挑战。近年来，LLM 在生成文本和代码方面展现出了强大的能力，为科学研究带来了前所未有的可能性。然而，如何系统化地利用这些模型来加速机器学习研究仍然是一个有待解决的问题。现有的研究往往只关注某一阶段，如生成研究假设或执行预定义的实验，未能涵盖整个研究过程，也未能充分解决当前研究中的具体问题。

为此，我们提出了 MLR-Copilot 自动化机器学习研究的研究平台 / 演示工具 (Demonstration)，利用大型语言模型（LLM）作为研究人员的 “副驾驶”，分析研究论文、提取研究问题，以提出新的研究思路和实验计划，并自动化执行这些实验以获得结果。MLR-Copilot 包括三个阶段：研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。

方法介绍

MLR-Copilot 框架的提出旨在通过 LLM 代理自动生成和执行研究思路验证，实现科研过程的自动化。该框架从单篇科研论文出发，模仿科研人员的研究思路，收集任务定义并获取当前研究工作的最前沿进展，以提出新的研究思路并自动化验证。

该框架首先从输入的研究论文中提取任务定义和研究空白，然后通过 IdeaAgent 生成研究思路（包括研究假设和实验计划），接着由 ExperimentAgent 实现并执行这些实验。在实验过程中，框架会持续观察和记录结果，必要时进行调整和优化，最终输出经过验证的研究成果。这种自动化流程显著提升了研究效率，确保了实验的可执行性和结果的可靠性。