探索“草莓”:迈向具备思考能力的人工智能的起点

   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

  

有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。

该项目的具体信息此前未曾披露,目前微软支持的初创企业正在积极展示其模型的高级推理能力。

根据路透社5月份获得的OpenAI内部文件,OpenAI的团队正在研发Strawberry。路透社无法确认该文件的具体日期,但文件中详细说明了OpenAI如何计划利用Strawberry进行研究。消息人士表示,该计划正在推进中,但路透社无法确定“草莓”何时会发布。

这位知情人士指出,即使在OpenAI内部,“草莓”的运作机制也是一个高度保密的内容。

据知情人士透露,该文件提到一个使用Strawberry模型的项目,旨在使公司的人工智能不仅能生成查询答案,还能提前进行充分的规划,自主且可靠地在互联网上导航,以执行OpenAI所称的“深度研究”。

根据对十多位人工智能研究人员的采访,这是当前人工智能模型尚未解决的难题。

当被问及“草莓”及相关细节时,OpenAI的一位发言人在声明中表示:“我们希望我们的人工智能模型能像我们一样理解这个世界。持续研究新的人工智能功能是行业的普遍做法,大家都相信,随着时间的推移,这些系统的推理能力将会得到提升。”

发言人没有直接回应关于“草莓”的问题。

草莓项目的前身是Q*,路透社去年报道,该项目在公司内部被视为一项重大突破。

两名消息人士描述了OpenAI员工早些时候展示的Q*演示,能够解决当前商用模型无法应对的复杂科学和数学问题。

另一位知情人士表示,OpenAI已在内部测试人工智能,其在数学数据集上的得分超过90%,该数据集是针对冠军数学问题的基准。路透社无法确认这是否与“草莓”项目相关。

据彭博社报道,在周二的一次内部全体会议上,OpenAI展示了一个研究项目的演示,声称该项目具备新的类人推理能力。OpenAI的一位发言人证实了会议的举行,但拒绝透露具体内容。路透社无法确认该项目是否为“草莓”。

知情人士表示,OpenAI希望这一创新能显著提升其人工智能模型的推理能力,并补充说,“草莓”涉及一种专门处理人工智能模型的方法,该模型是在非常大的数据集上进行预训练的。

路透社采访的研究人员表示,推理是人工智能实现人类或超人类智能水平的关键。

尽管大型语言模型已经能够比人类更快地总结复杂文本和撰写优美散文,但在解决对人类而言似乎直观的常识性问题时,这种技术往往表现不足,例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时,通常会产生“幻觉”或虚假信息。

接受路透社采访的人工智能研究人员普遍认为,在人工智能的背景下,推理包括构建一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。

提升人工智能模型的推理能力被视为解锁模型潜力的关键,这将影响从重大科学发现到规划和构建新软件应用程序的各个方面。

OpenAI首席执行官萨姆·奥特曼早些时候表示,在人工智能领域,“最重要的进展将围绕推理能力展开。”

谷歌、Meta和微软等其他公司也在尝试不同的技术来提升人工智能模型的推理能力,大多数从事人工智能研究的学术实验室也是如此。然而,关于大型语言模型是否能够将想法和长期规划纳入预测方式,研究人员意见不一。例如,现代人工智能的先驱之一、Meta公司的Yann LeCun经常表示,法学硕士不具备类似人类的推理能力。

人工智能的挑战

知情人士称,Strawberry是OpenAI克服这些挑战计划的关键组成部分。路透社看到的文件描述了“草莓”的目标,但未说明如何实现。

据四名听过该公司宣传的人士透露,近几个月来,该公司一直在私下向开发者和其他外部各方暗示,技术即将发布,具备更先进的推理能力。他们拒绝透露身份,因为未获授权讨论私事。

其中一位消息人士称,“草莓”包括一种被称为“后训练”的OpenAI生成式人工智能模型的专门方法,即在对大量广义数据进行“训练”后,对基础模型进行调整,以特定方式提升其性能。

开发模型的后训练阶段涉及“微调”等方法,这是当今几乎所有语言模型都使用的过程,形式多样,例如让人类根据模型的反应提供反馈,并给予模型好的和坏的答案。

据知情人士透露,“草莓”与斯坦福大学2022年开发的“自学推理器”或“STaR”方法有相似之处。STaR的创始人之一、斯坦福大学教授诺亚·古德曼对路透社表示,STaR使人工智能模型能够通过迭代创建自己的训练数据来“引导”自己达到更高的智能水平,理论上可以用来让语言模型超越人类的智能水平。

“我认为这既令人兴奋又令人担忧……如果事情继续朝这个方向发展,我们作为人类将面临一些严肃的考量,”古德曼说。Goodman并不隶属于OpenAI,也不熟悉Strawberry。

第一个消息来源解释说,OpenAI将“草莓”瞄准的功能之一是执行长期任务(LHT),指的是需要模型提前计划并在较长时间内执行一系列动作的复杂任务。

OpenAI的内部文件显示,为此,OpenAI正在创建、训练和评估其所谓的“深度研究”数据集上的模型。路透社无法确认数据集的具体内容,也无法确定延长的时间意味着多长。

根据该文件和其中一位消息人士的说法,OpenAI特别希望其模型能够利用这些功能,在“CUA”(即使用计算机的代理)的帮助下自主浏览网页,从而进行研究。CUA可以根据其发现采取行动。OpenAI还计划测试其在软件和机器学习工程师工作方面的能力。

安娜·唐(Anna Tong)旧金山报道,凯蒂·保罗(Katie Paul)纽约报道;Ken Li和Claudia Parsons编辑。2024年版权。版权所有。本材料不得出版、广播、重写或重新分发。

本文来自作者[尔岚]投稿,不代表qgxnj号立场,如若转载,请注明出处:https://www.qgxnj.cn/zskp/202507-1073.html

(3)

文章推荐

  • 马提尼克岛因暴乱实施宵禁,禁止所有抗议活动

      1分钟阅读在Facebook上分享,通过电子邮件分享inkedin马提尼克岛当局周四将禁止抗议活动,并宣布实施新的宵禁。此前,因物价飙升而引发的新一轮骚乱导致一人被枪杀,26名警察受伤,商店被洗劫,政府消息人士告诉法新社。最近几周,这个拥有

    2025年07月03日
    6
  • 自九月初以来,黄金价格已上涨6.4%

    ˂imgsrc="http://www.08082016.vip/file/upload/202411/04/080155291.jpg"自9月初以来,金价已累计上涨6.4%,有望创下第三次上涨纪录nsecutive莫由于全球对避险资产的需求激增,第二次上涨。金价周四保持稳定

    2025年07月04日
    3
  • 查谟克什米尔首席部长奥马尔·阿卜杜拉与联邦内政部长阿米特·沙阿会晤,共商国家建设议题

      PTI查谟克什米尔首席部长奥马尔·阿卜杜拉在新德里会见了联邦内政部长阿米特·沙阿。(图片:News18)这是他第一次访问这个国家上周就职后,奥马尔·阿卜杜拉与内政部长阿米特·沙阿进行了近30分钟的会谈

    2025年07月07日
    5
  • 群体主导性是归属政策的重要考量

    托尔托拉岛主岛的一部分。总理NatalioWheatley博士强调,其他民族群体成为英属维尔京群岛主要群体的前景,是制定政府在该领土授予居留权和归属身份政策时要考虑的关键因素之一。“我们是否应该考虑到不同国籍的人之间应该要求的那种平衡?你希望

    2025年07月09日
    6
  • 美联储或将摆脱通胀高位的困扰

      华盛顿(路透社)-2021年9月,在经历了三个月的价格上涨之后,美联储2%的目标上涨了一倍多,美联储工作人员和政策制定者改变了对通货膨胀的消极态度,开始将其描述为“升高”。当年5月、6月和7月,美联储用来设定通胀目标的个人消费支出价格指数(PCE)超过了

    2025年08月03日
    5
  • 奥利·戈登二世助攻5次,俄克拉何马州立大学在20加时战胜杨百翰大学晋级12强

      俄克拉荷马州斯蒂尔沃特市。(美联社)——奥利·戈登二世在第二个加时赛中触地得分,排名第21的俄克拉荷马州立大学在落后18分的情况下以40-34击败杨百翰大学,确保了12大联盟冠军赛的席位。在戈登的最后得分后,杨百翰大学有机会获胜,但俄克拉荷马州立大学的特雷·拉克在一次接球后从艾萨克·

    2025年08月08日
    4
  • 菲律宾渔民漂流海上47天后成功获救

      马尼拉,9月20日(IANS):周五,菲律宾海岸警卫队透露,一名49岁的菲律宾渔民在海上漂流了47天,依靠雨水、椰子和鱼生存,最终被救起。据新华社报道,来自马尼拉东南部奎松省的罗宾·德吉略在8月4日出海捕鱼时因船只缺油而失踪。海岸警卫队的人

    2025年08月11日
    5
  • 推荐必备“旺旺拼三张有没有挂”原来真实可以装挂

    旺旺拼三张有没有挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出手

    2025年08月12日
    6
  • 布里瓦德县的健美冠军:一位充满活力的母亲

    佛罗里达州布里瓦德县我们中的许多人在人生的某个阶段都有一个遗愿清单。这是一张我们想做的事情的花名册,我们想趁还来得及去的地方。虽然遗愿清单很常见,但布里瓦德县一位妇女的遗愿清单却很不常见。雪莉·普里亚米是三个孩子的母亲,她想参加一场健美比

    2025年08月13日
    6
  • 日本为应对近期疑似干预采取了哪些措施?

    路透东京8月8日电---日本本月被怀疑多次干预汇市以支撑日圆,突显出日本对进口商品价格上涨导致日圆下跌给家庭带来的痛苦感到不安。尽管当局尚未证实是否干预汇市,但以下内容解释了日本政府的干预策略,以及此举对日本货币政策可能意味着什么:他们为什么要

    2025年08月14日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 尔岚
    尔岚 2025年07月24日

    我是qgxnj号的签约作者“尔岚”!

  • 尔岚
    尔岚 2025年07月24日

    希望本篇文章《探索“草莓”:迈向具备思考能力的人工智能的起点》能对你有所帮助!

  • 尔岚
    尔岚 2025年07月24日

    本站[qgxnj号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 尔岚
    尔岚 2025年07月24日

    本文概览:   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

    联系我们

    邮件:qgxnj号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们