Ai2(艾伦人工智能研究所)今天推出了Asta,这是一个集成的开放生态系统,旨在改变使用人工智能代理进行科学研究的方式。当人工智能工具充斥着研究领域时——通常是不透明、未经测试和未经证实的——Asta提供了一种有原则的替代方案:一个全面的集合,包括一个代理人工智能研究助理、第一个严格的科学代理基准套件,以及一套用于构建值得信赖的工具的开发人员资源。
这些组件共同构成了高性能科学人工智能的基础,它是透明的、基于证据的,旨在赢得科学家、开发人员和机构的信任。
Ai2首席执行官Ali Farhadi表示:“人工智能可以为科学带来变革,但前提是它必须与科学本身保持相同的标准。”“借助Asta,我们不仅在构建一个助手,还在构建一个建立在透明度、可重复性使用和科学严谨性基础上的生态系统。它专为真正的研究人员解决实际问题而设计,也是为开发人员创造下一代为加速科学发现而设计的代理工具。”
Asta:一个新型研究伙伴
Asta的核心是一个专门为科学家设计的开源人工智能助手。与通用工具不同,Asta了解科学研究工作流程的需求。它不仅检索信息,还审查文献,综合证据,并(在测试版中)分析数据,同时提供引用。
Asta已经被包括芝加哥大学和华盛顿大学在内的194所机构的研究人员使用,它正在加速现实世界的发现——从确定治疗靶点到探索新的研究领域。
芝加哥大学知识实验室主任James Evans说:“研究人员比以往任何时候都更难进行文献检索和综合。”“Ai2的Asta人工智能代理、基准和工具生态系统有助于打破这些障碍。它的系统有望加速从直觉到洞察力的道路,改变我们在科学理解的广阔领域中的导航方式。”
一个完全集成的科学人工智能生态系统
Asta不是一个独立的工具。这是一个全栈生态系统,旨在支持科学人工智能开发和使用的整个生命周期:
Asta:一个开源的人工智能代理研究助理,帮助科学家浏览文献、综合发现和分析数据。它完全透明,引用来源,旨在集成到现实世界的工作流程中。
AstaBench:一个严格的基准测试套件,为复杂的多步骤研究任务(从文献理解到代码执行和端到端发现)的科学AI代理性能设定了标准。它在11个基准测试中推出了2400多个问题,为研究人员和开发人员提供了一种可重复的、基于证据的方法来评估和比较代理。在发布时,AstaBench包括16个排行榜,涵盖所有基准类别、四个子类别的代理性能,以及包括性能和成本效益在内的总体排名。
Asta Resources:一个开发者工具包,包括开源代理、API、科学后训练语言模型,以及对科学语料库工具的访问,这是Ai2语义学者API基础设施的MCP扩展(200多万篇论文)。它提供了构建和评估值得信赖的科学代理所需的一切。
Ai2首席科学家Dan Weld说:“在建造Asta时,我们专注于研究人员面临的问题。”。“我们需要人工智能工具,通过执行复杂的多步骤计划、解释他们的想法并以证据为基础,真正节省我们的时间。这就是Asta所提供的。它不仅仅是一个助手,而是一个旨在像科学家一样思考的合作者。”
为科学人工智能设定标准
随着代理人工智能获得动力,噪音也在增加。新的工具每周都会出现,通常都有不透明的声明,也没有标准的评估方法。作为一个全面的框架,用于在真实的科学任务上测试和比较人工智能代理,而不是合成提示,Asta用AstaBench填补了这一空白。
Asta v0科学代理在Ai2的初步评估中以52.5%的得分领先,比次佳系统高出近10分。GPT-5 mini和Claude 3.5 Haiku搭配专用框架也是强有力的竞争者,这要归功于它们的低成本。然而,AstaBench揭示了许多智能体在编码等复杂任务中苦苦挣扎,突显了未来的挑战和专门构建的科学智能体的价值。
此基准测试套件与Asta资源配对,后者为开发人员构建满足相同高标准的代理提供了构建块。开发人员可以使用Asta资源构建代理,然后使用AstaBench对其进行评估,从而创建一个整个生态系统都能从中受益的科学改进器。
Asta的独特之处不仅在于它的功能,还在于它的构建方式:完全开源、开放获取,并以科学价值观为基础。当其他人竞相通过封闭系统和专有代理来定义该领域时,Ai2正在制定一条透明、有原则且旨在发展的集体前进道路。
展望未来
Asta只是个开始。随着科学人工智能领域的不断发展,Ai2致力于通过新的功能和工具来扩展Asta,从而突破研究人员和开发人员的能力界限。
Asta最令人兴奋的功能之一是数据分析。它允许用户上传自己的真实世界数据集,并使用自然语言进行探索。他们可以提出复杂的问题,并得到基于统计推理的严格、可解释的答案。它旨在通过生成和测试新的假设来加速数据驱动的发现,可以支持社会科学、生物学和气候研究等领域的工作,帮助科学家从原始数据转向有意义的结论。
未来的Asta版本还将包括实验复制、科学编程和长期研究规划等高级功能,使我们更接近能够真正支持端到端科学工作流程的人工智能研究助理。
NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。
更新时间:2025-08-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号