AI研究人员推出GAIA通用AI助手基准测试工具

来源:
导读 隶属于人工智能初创公司 Gen AI、Meta、AutoGPT、HuggingFace 和 Fair Meta 的研究人员团队开发了一个基准工具,供人工智能助手制造

隶属于人工智能初创公司 Gen AI、Meta、AutoGPT、HuggingFace 和 Fair Meta 的研究人员团队开发了一个基准工具,供人工智能助手制造商使用,特别是那些制造基于大型语言模型的产品的制造商,以测试其应用程序作为潜在的人工智能通用智能(AGI)应用。他们写了一篇论文,描述了他们的工具(他们将其命名为 GAIA)以及如何使用它。该文章发布在arXiv预印本服务器上。

在过去的一年里,人工智能领域的研究人员一直在私下和社交媒体上争论人工智能系统的能力。一些人认为人工智能系统已经非常接近通用人工智能,而另一些人则认为相反的情况更接近事实。所有人都同意,这样的系统将在某种程度上匹配甚至超越人类的智能。唯一的问题是什么时候。

在这项新的努力中,研究小组指出,为了达成共识,如果真正的通用人工智能系统出现,就必须建立一个评级系统来衡量它们之间以及人类之间的智力水平。他们进一步指出,这样的系统必须从基准开始,这就是他们在论文中提出的建议。

该团队创建的基准由向未来人工智能提出的一系列问题组成,并将答案与随机一组人类提供的答案进行比较。在创建基准时,团队确保问题不是典型的人工智能查询,而人工智能系统在典型的人工智能查询中往往得分很高。

相反,他们提出的问题往往是人类很容易回答但计算机却很难回答的问题。在许多情况下,寻找研究人员设计的问题的答案需要经历多个工作步骤和/或“思考”。例如,他们可能会针对在特定网站上找到的内容提出特定问题,例如“根据维基百科的报道,根据美国农业部标准,给定品脱冰淇淋的脂肪含量高于或低于多少?”

研究团队测试了他们使用的人工智能产品,发现没有一个产品接近通过基准,这表明该行业可能并不像一些人想象的那样接近开发真正的通用人工智能。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!