沙丘社区Logo
发布
登录
注册
沙丘社区Logo

OpenAI AGI进展:AI Infra是竞争关键、AI Agent是必经之路

作者:沙丘社区香料间2025年4月15日
454
数字化转型IT与云服务大数据人工智能AIGC大模型

作者|沙丘智库研究团队

来源|沙丘社区(www.shaqiu.cn)

在2025年3月5日举行的高盛颠覆性技术峰会上,OpenAI首席财务官、前高盛技术股票研究主管Sarah Friar与高盛全球银行与市场联席主管Dan Dees讨论了OpenAI在通用人工智能(AGI)方面的最新进展以及资本在人工智能竞赛中的重要性。核心要点如下:

第一,OpenAI的定位不仅仅是模型层,而是全栈延伸。一方面,深入数据中心,致力于AI基础设施2.0的建设,强调知识产权的重要性;另一方面,从模型层上升到API层,将影响力继续扩大到企业和开发者,并且再上一层到应用层,服务消费者的个人生活和工作生活。

第二,OpenAI认为AI基础设施是未来发展的关键,类似于云计算的早期阶段。OpenAI 的Stargate项目计划在未来四年内投资5000亿美元,用于建设新的AI基础设施,包括数据中心和计算能力。

第三,2025是智能体之年,是通向AGI的必经之道路。OpenAI现在已经正在进行三个智能体方面的工作:Deep Research(深度研究)、Operater(操作员)和即将要发布的A-SWE(Agentic Software Engineer,智能软件工程师)。

第四,在银行业等受严格监管的垂直行业中,OpenAI已经在信用欺诈检测、KYC、AML等领域取得了成功。OpenAI正在构建具体的案例研究,以展示AI在不同行业中的实际应用和价值。

以下是沙丘智库对本次对话的全文整理,在不改变原意的基础上略有删改。

Dan Dees:先说说你的个人背景,以及你一路走来的经历。你出生在北爱尔兰,在高盛担任过领导职务,之后你去了麦肯锡、Salesforce、Square,现在你在OpenAI。简单介绍一下你的经历,是什么让你来到OpenAI,以及在这些转变中你所遵循的原则是什么?

Sarah Fryer:OpenAI是我现在认为最具影响力的公司,这个公司正在最具影响力的领域工作,我认为这比我们迄今为止看到的任何技术浪潮都要大。我没有经历过PC革命,但当互联网兴起时,我正从麦肯锡前往斯坦福商学院。我是2000年毕业的,当时互联网泡沫正在上升,我们也看到了泡沫破裂后硅谷的几年寒冬,然后又见证了移动技术的兴起以及它对公司的影响。坦率地说,我在高盛的职业生涯就是在谈论向云计算的转变,所以现在能够谈论AI对整个世界的影响,从政府层面到企业、商业、教育,我们可以深入探讨这些话题,但同时,现在也开始谈论AI基础设施,这感觉就像是云计算黎明的再现,尽管架构和构建方式完全不同。所以我现在正在做的事情非常有趣,我认为对于你们所有人来说,经历这一切也同样令人兴奋。

Dan Dees:你和很多人交流过,这些人中有很多是企业的领导者,他们都在学习你分享的经验。你从这些经验中学到了什么,你又如何将这些经验分享给这些人呢?

Sarah Fryer:首先,我认为世界上没有一个CEO、企业领导者现在不知道他们需要将AI部署到他们的业务中,并且不觉得自己落后了。即使是像我这样的OpenAI内部的领导者,当我加入时,我想了解的是,我的财务团队自己在使用什么工具。我看到的情况是有一些人已经走在前面,完全接受了AI,然后还有很多新的人加入,他们来自没有AI的其他组织。

所以实际上,我做的第一件事就是和我的团队一起坐下来,举办一个黑客马拉松。我们邀请了销售团队、解决方案工程师,举办了一次研讨会,大家坐在一起讨论每天需要做的例行公事、以及工作中不喜欢的部分,然后进行分组,比如税务团队、采购团队、投资者关系团队,然后在不同组之间进行比较。然后我们只是做了一个非常基础的自定义GPT构建,尝试能不能在半小时内做一些事情,让我们的生活变得更好。

仅仅从这一点来看,我所在的投资者关系团队就充满了能量和兴奋。当我加入OpenAI时,公司正在进行一轮大规模融资,正处于尽职调查的地狱中。投资者提出的问题差不多,但又不完全相同。通过创建一个自定义的GPT,可以回答所有这些问题,这让我们觉得非常激动。

这只是让大家感受到一般性的生产力提升,今天我会进一步展示Deep Research。我们有点惭愧,因为它直到大约一周前才在我们的Pro SKU中可用,我们刚刚将其推广到企业SKU中。

Deep Research是让模型去做那些需要分析师做的研究工作。与我们合作的一家银行,他们的团队有效地使用了Deep Research,比大部分分析师做的要好得多。所以如果你还没有用过Deep Research,只需要花费200美元购买Pro SKU就可以。

Dan Dees:OpenAI当前正处于AI发展的哪一阶段?我们将在近期看到哪些新的突破?

Sarah Fryer:首先,我要先设定一下我们公司目前所处的位置。

0415配图1.png

如果是在2年前,我们会展示橙色的条形图,上面写着我们是一家模型公司,我们的目标始终是成为最先进的模型公司。两年前,它是ChatGPT系列,我们从ChatGPT-3发展到ChatGPT-4,这花费了大约18个月到2年的时间。

去年,我们首次推出了推理功能,也就是o系列模型。从更倾向于预测性的、快速的实时回答模型转变为现在更像人类推理的模型。

但今天,OpenAI不仅仅是这样。我们正在深入数据中心技术,因为我们认为我们现在正处于AI基础设施2.0时代。我们在那里创造了大量的知识产权,拥有他们是真的很重要。想想亚马逊当初在电子商务领域做得很好,然后他们看到AWS开始成形。如果在那个阶段,他们决定将它外包给谷歌这样的新兴公司,放弃AWS的所有知识产权,那将会是非常大的不同。AWS本身在云计算中占据了40%的市场份额,运营利润率为38%。所以我们认为基础设施部分将有着巨大的潜力。

此外,我们也正在从模型层上升到API层,这使我们能够将影响力继续扩大到企业和开发者,并且再上一层到应用层,即我们如何推动功能特性,让消费者无法是在个人生活还是工作生活中,都能爱上这些应用。所以,在ChatGPT的背后,你现在可以使用Sora生成视频,可以使用Deep Research进行深度研究,可以搜索,可以创建项目,可以编写代码,可以创建一个写作画布。

我们的目标是持续完善这些功能,原因在于,第一,它使我们保持作为主导玩家的地位,每周有1亿活跃用户;第二,它推动了个性化,使模型开始更多地了解用户,从而创造了用户粘性。

接下来让我们来谈谈实现AGI(通用人工智能)的五个步骤。

0415配图2.png

2023年,我们推出聊天机器人ChatGPT,实现了实时预测性回答;去年,我们推出了推理功能,现在有了一个思考时间更长、可以完成长周期任务的模型。2025年则是智能体之年,我们从去年第三季度或第四季度开始谈论Agent,现在它已经成为行业使用的术语。

我们现在已经正在进行三个智能体方面的工作:

第一,Deep Research,这是一个智能体工具,可以为你做一份真正的深度研究报告;

第二,Operater,这是我们推出的一项服务,可以做一些需要联网后在后台花费时间做的事情,比如预订航班、预订假期、预订晚餐等;

第三,即将发布的A-SWE(Agentic Software Engineer),这是一种能够自主构建应用程序的AI软件工程师,可以接受你给任何其他工程师的PR并去构建它。除了构建应用之外,它还可以做软件工程师不喜欢做的所有事情,它可以自己进行软件测试、质量保证和错误修复,它做了永远无法让软件工程师做的文档工作,使软件工程师团队的生产力倍增。

回到那个橙色的条形图,就最先进的模型而言,o3仍然是当前市场上最先进的模型。

0415配图3.png

图上展示的都是被广泛认可的基准,用来判断AI是否正在成为AGI。从软件工程、竞争性编码、竞争性数学、Phd级别科学等角度看,o3是最好的模型。而且o3 Mini已成为“世界第一的竞技编程选手”。

当然,以上这些都是硬技能,实际上我们花了很多时间思考模型的情商(EQ)问题。最近发布的GPT4.5版本,我们花了更多时间训练,让它拥有硅谷喜欢的称之为“氛围”的东西,但实际上是情商(EQ)。所以当你和它交流时,会感觉到非常人性化。它实际上更适合用于设计、写作或创意概念,而不是纯粹的数学和科学。

Dan Dees:你刚刚提到了AGI,你对AGI的具体定义是什么,OpenAI什么时候会达到AGI?

Sarah Fryer:对于AGI的定义,我们认为是AI系统可以承担世界上大多数真正有价值的人类工作,我们已经非常接近这个目标了。

我不是生物学、物理学、数学、编码等领域的PhD,所以AI可能已经在这些领域超越了我。所以问题是技术是否已经存在,但我们可能还没有充分利用它。所以,我们会说我们已经非常接近这个点了。

我想从这里开始,还有很多事情要做,因为那是一个非常平坦的世界,大部分的互动都是通过指尖、语音、听觉或视觉进行的。

还有一个全新的AI世界,它变得更加3D,真正实现机器人技术的应用,比如工厂、农业等领域,我们已经看到技术开始进入这些领域,但还没有完全进入。我认为这将是一个全新的、非常广泛的领域,正在等待探索。

Dan Dees:之前Sam Altma(OpenAI创始人)和Larry Ellison(Oracle创始人)在白宫讨论过AI设计的疫苗可以治愈癌症的想法。这是真实的吗?还有哪些其他的宏伟蓝图?

Sarah Fryer:我认为这是非常真实的。这也是我提到的,在学术界的专业知识领域,可能已经在发现世界上新的东西了。

当前,实际上有三条扩展定律(scaling laws)正在发生:

第一,预训练扩展。如果只是想让通用模型变得更聪明时,这倾向于需要更多的数据、更多的算法专业知识,所以研究人员可以在更多的计算能力上发挥作用。当然,这导致了一个需要大量资本才能真正成功的行业。GPT-3、GPT-4、GPT-5,它们都是在这些巨大的计算结构上发生的,呈现指数级的增长。

第二,后训练扩展。后训练是微调的开始,如果想创建一些真正擅长诊断疾病的模型需要吸收所有可用的人类信息,一般来说,首先创建一个通用模型,然后微调时深入研究医学教科书,让模型在诊断方面非常擅长。后训练也有很多规模扩展,我们在后训练阶段进行了很多技术创新,这也是我们的o系列推理模型能力提升的原因。

第三,测试时扩展。当模型在推理时,你可以要求它更深入一点,多用一点计算能力,看看是否能找到一个更准确的答案。

通用模型就像建造了一辆汽车,你弄清楚了汽车的车轮、引擎、悬挂是什么,为了让它移动;微调就像是让这辆车能够赛车,需要安装不同的引擎;推理则是把它调到运动模式的那一刻,从普通的四轮驱动模式切换到运动模式。

我们最近推出了一项名为强化微调的功能。我们的研究人员发现,实际上模型不需要太多信息就能在某个特定领域显示出显著的输出提升,但关键是能否进入那个特定的领域。

Dan Dees:OpenAI宣布建立“星际之门计划”(The Stargate Project),计划在未来四年内投资5000亿美元,为OpenAI在美国建设新的人工智能基础设施。你是如何思考这个问题的?你如何看待围绕这一点的电力和基础设施需求?

Sarah Fryer:是的,我们宣布的Stargate是一项5000亿美元的计算资源投资,这是一种简化的说法,实际上我们需要10吉瓦的计算能力。我们是如何得出这个数字的呢?这是一个很大的数字,我刚刚谈到了这三个规模定律,模型开发的每一个阶段都需要越来越多的计算能力。

因为没有足够的计算资源,我们决定不推出模型。我们的视频生成模型Sora,在去年2.3约就已经准备好了,但直到去年十二月才推出,在欧洲甚至还没有完全推出。我们推出了深度研究,我们知道商业界会喜欢这个功能,但我们没有足够的计算能力来将其扩展到商业规模。

2-3年前做计算资源决策的人无法想象我们对计算能力的需求会增长得如此之快,他们无法想象我们的业务会发展得如此之快,就像我们在短短两年内就增长到了每周4亿活跃用户,我们的收入每年都在翻三倍。

10GW是一个很大的数字,它甚至是一个公用事业的负载,爱尔兰整个国家的用电量是7GW。所以这确实引发了关于如何扩展的问题。电力将从哪里来?我们如何考虑一个以可再生能源为主的世界,以及我们如何考虑我们的气候和环境?我们如何考虑重新培训人力以进行这种建设呢?

政府会对Stargate计划感兴趣,是因为虽然它是一项金融投资,但它也是对工作、经济开发区、如何保持领先的一种全面重新思考,然后地缘政治开始发挥作用,因为我们正与中国进行一场竞赛,正如我们刚刚看到的,与DeepSeek的竞赛。我们不应该轻视这一点,因为这涉及到国家安全等问题。

Dan Dees:在个人生活和商业生活中,我们都需要弄清楚如何在业务中部署AI,最佳实践是什么?

Sarah Fryer:关于这项技术的好消息是,大多数人都已经在个人生活中尝试使用它了。特别是35岁以下的人,他们在学校里使用它。在我们的教育SKU,我们看到越来越多的大学系统正在部署ChatGPT。亚利桑那州立大学(ASU)已经在学生、教师和研究人员中部署了181000个席位。加利福尼亚州立大学刚刚部署了500000个席位。

爱沙尼亚作为一个国家,刚刚全面部署了ChatGPT,覆盖所有中学,该国的每一所中学都将能够使用ChatGPT进行学习。无论你是否喜欢,每个人都在使用它,并且正在学习如何以个人方式使用它。人们普遍期望这项技术已经能够增加价值。这就像从一开始就具有价值一样,所以我认为好的一面是让“百花齐放”。

但在具体的行业,以银行业为例,这是一个受到严格监管的行业。我们已经进入了一些机构,并在某些领域取得了成功,落地了案例。因此,当我们来到你们这个特定的行业时,我们实际上可以带来一些很好的例子。在刚才提到的银行例子中,我们通常看到的应用是在诸如信用欺诈检测、KYC、反洗钱(AML)等领域,以及财富管理和研究领域。对我们来说,关键在于如何构建这些案例,并将它们推向世界。这样,当企业高管前来时,我们不仅仅是在空谈,而是实际上可以展示一些具体的例子,说明如何能够节省成本或者增加收入。

Dan Dees:OpenAI接下来的投资计划和投资方向是什么?你是如何看待在私人市场和公开市场中筹集资金的?这其中的权衡和想法是什么?

Sarah Fryer:目前的投资重点是计算能力、研究人员和数据这三个领域。

通过Stargate的视角来看计算能力,这将是一个很大的挑战,它必须在世界上作为一个实体出现。我们需要找到地点、电力,我们需要挖洞、建设数据中心、填满设备、购买GPU,并证明我们能够做到这一点。我认为这将是北美连续的一部分,但也是一个全球性的推动,因为我们在很多情况下都想把数据中心建得离客户更近,这是与政府合作的好方法。

研究人员就是研究人员,我们想聘请最优秀、最聪明的人,当然,我们还想帮助学校系统继续推动这些人成长,因为这确实是一个新的领域。现在还没有很多的AI博士生,但这个数字正在快速增长。

在数据方面,我们正在与数据提供商合作等。

至于IPO,我甚至无法想象。我现在有太多事情要做,但我相信在某个时候,成为一家上市公司是一种良好的公司治理,阳光是任何金融企业的最佳消毒剂。

更多研究(可前往“沙丘智库”查阅)

AI Agent架构设计模式研究报告

2025年中国银行业大模型应用跟踪报告

国资央企DeepSeek大模型应用跟踪报告

银行业DeepSeek大模型应用跟踪报告

2025年中国保险业大模型应用跟踪报告

2024年AI Agent最佳实践报告

2024年“大模型+数据分析”最佳实践报告

...

*更多生成式AI研究可前往“沙丘智库”小程序查阅

*有任何需求可咨询客服微信:zimu738

沙丘社区官方账号。

363篇原创内容
阅读 454
收藏
沙丘社区Logo专注人工智能和大数据的数字技术社区
联系我们
  • 客服微信: zimu738
  • 加入我们: hr@shaqiu.cn
  • 业务合作: miao_tim
  • 内容投稿: service@shaqiu.cn
公众号
智库小程序
客服微信