纽约 - Facebook母公司Meta Platforms Inc.今天宣布从其研究部门发布新的人工智能(AI)模型。其中包括一个"自学评估器",这可能会减少人类在AI开发过程中的参与。这个工具最初于8月份在一篇研究论文中介绍,采用了类似于OpenAI最新模型使用的"思维链"技术。
这种方法将复杂问题分解为更小的逻辑步骤,提高了在科学、编码和数学等困难领域的响应准确性。
"自学评估器"仅使用AI生成的数据进行训练,这意味着在开发的这个阶段不需要人类输入。这一进步暗示了创建能够从自身错误中学习的自主AI代理的潜力。根据Meta研究人员的说法,这些自我改进的模型最终可能无需人类帮助就能执行广泛的任务,超越当前对人类反馈强化学习(RLHF)的需求。RLHF是一种成本高昂且效率较低的方法,需要专门的人类注释者来标记数据并验证复杂的答案。
Meta研究人员之一Jason Weston分享了他对AI未来的愿景,他表示:"我们希望,随着AI变得越来越超人,它将越来越擅长检查自己的工作,以至于实际上会比普通人类更好。"他强调了自学和自我评估在达到前所未有的AI熟练程度方面的重要性。
虽然其他公司,如Google和Anthropic,也对类似概念如AI反馈强化学习(RLAIF)进行了研究,但Meta的独特之处在于将其模型公开供公众使用。
除了"自学评估器",Meta今天还推出了更新的AI工具。这些包括对公司的图像识别Segment Anything模型的改进,一个加速大型语言模型(LLMs)响应生成时间的工具,以及支持发现新无机材料的数据集。
路透社对本文有所贡献。
本文由人工智能协助翻译。更多信息,请参见我们的使用条款。