首页 / 财富中文网 / 正文

麻省理工学院报告:企业95%的AI项目以失败告终

财富中文网 2025-08-22 01:10:48

麻省理工学院报告:企业95%的AI项目以失败告终
图片来源:Getty Images

当下企业纷纷押注人工智能,然而几乎所有企业试点项目都在起步阶段陷入困境。

麻省理工学院(MIT)网络代理和去中心化人工智能计划发布的最新报告《生成式人工智能的鸿沟:2025年商业人工智能现状》显示,尽管生成式人工智能对企业而言潜力巨大,但多数旨在推动收入快速增长的举措均未达预期。

尽管企业急于整合功能强大的新模型,但仅有约5%的人工智能试点项目实现了收入迅猛增长;绝大多数项目则陷入停滞状态,未能对企业损益表(P&L)产生任何可量化衡量的影响。这项研究基于对150位企业领导者的访谈、350名员工的调研,以及对300个公开人工智能部署案例的分析,清晰地揭示了“成功案例”与“停滞项目”之间的巨大差距。

为深入解读这一研究结果,笔者采访了报告主要作者、麻省理工学院网络代理和去中心化人工智能计划研究贡献者阿迪蒂亚·查拉帕利(Aditya Challapally)。

“部分大型企业的试点项目与新兴初创公司在生成式人工智能领域取得显著成效。”查拉帕利表示。例如,那些由19岁或20岁年轻人领导的初创公司,“仅用一年时间便实现了收入从0到2000万美元的飞跃”。他补充道:“这背后的原因是他们聚焦单一痛点、高效执行,并与使用其工具的企业建立了明智的合作关系。”

然而在研究覆盖的95%的企业中,生成式人工智能的实施成效差强人意。核心问题并非出在人工智能模型质量上,而是工具与企业层面均存在“认知差距”。尽管高管们常将失败归结于监管限制或模型性能不佳,但麻省理工学院的研究指出,根源在于企业整合方式存在缺陷。查拉帕利解释道,ChatGPT等通用型人工智能工具因其灵活性在个人使用场景中表现优异,但在企业场景中却陷入停滞——因为这类工具无法从企业工作流程中学习,也无法适配工作流程需求。

研究数据还揭示了企业在资源分配上的错位:超过一半的生成式人工智能预算用于销售与营销工具,但麻省理工学院发现,后台工作自动化的投资回报率最高——通过取消业务流程外包、削减外部机构成本以及优化运营流程实现。

成功的人工智能部署背后有哪些关键因素?

企业的人工智能应用方式至关重要。从专业供应商处采购人工智能工具并建立合作关系的模式,成功率约为67%;而企业内部自主开发的成功率仅为前者的三分之一。

这一发现对金融服务及其他受严格监管的行业而言尤为关键——2025年,这些领域的许多企业都在自主研发专属生成式人工智能系统。然而,麻省理工学院的研究表明,企业独自开展开发工作时遭遇失败的概率要高得多。

查拉帕利指出,受访企业往往不愿透露失败率。“几乎所有我们调研的企业,都曾尝试自主开发工具。”他说道,但数据显示,采购解决方案能带来更为可靠的结果。

其他促成成功的关键因素包括:赋予业务经理(而非仅依赖中央人工智能实验室)推动人工智能应用的权力,以及挑选能够深度集成且随时间推移不断适应的工具。

劳动力结构调整已然启动,尤其涉及客户支持与行政岗位。企业不再沿袭过往大规模裁员的模式,而是愈发倾向于在职位出现空缺时选择不再填补。大多数变革集中在此前因被视为低价值而外包的岗位。

报告还强调了“影子人工智能”(指ChatGPT等未获企业授权的工具)的广泛应用,以及“衡量人工智能对生产力与利润的影响”这一持续存在的难题。

展望未来,最前沿的企业已开始试验智能体人工智能系统——这类系统能够在设定范围。(*)

译者:中慧言-王芳

当下企业纷纷押注人工智能,然而几乎所有企业试点项目都在起步阶段陷入困境。

麻省理工学院(MIT)网络代理和去中心化人工智能计划发布的最新报告《生成式人工智能的鸿沟:2025年商业人工智能现状》显示,尽管生成式人工智能对企业而言潜力巨大,但多数旨在推动收入快速增长的举措均未达预期。

尽管企业急于整合功能强大的新模型,但仅有约5%的人工智能试点项目实现了收入迅猛增长;绝大多数项目则陷入停滞状态,未能对企业损益表(P&L)产生任何可量化衡量的影响。这项研究基于对150位企业领导者的访谈、350名员工的调研,以及对300个公开人工智能部署案例的分析,清晰地揭示了“成功案例”与“停滞项目”之间的巨大差距。

为深入解读这一研究结果,笔者采访了报告主要作者、麻省理工学院网络代理和去中心化人工智能计划研究贡献者阿迪蒂亚·查拉帕利(Aditya Challapally)。

“部分大型企业的试点项目与新兴初创公司在生成式人工智能领域取得显著成效。”查拉帕利表示。例如,那些由19岁或20岁年轻人领导的初创公司,“仅用一年时间便实现了收入从0到2000万美元的飞跃”。他补充道:“这背后的原因是他们聚焦单一痛点、高效执行,并与使用其工具的企业建立了明智的合作关系。”

然而在研究覆盖的95%的企业中,生成式人工智能的实施成效差强人意。核心问题并非出在人工智能模型质量上,而是工具与企业层面均存在“认知差距”。尽管高管们常将失败归结于监管限制或模型性能不佳,但麻省理工学院的研究指出,根源在于企业整合方式存在缺陷。查拉帕利解释道,ChatGPT等通用型人工智能工具因其灵活性在个人使用场景中表现优异,但在企业场景中却陷入停滞——因为这类工具无法从企业工作流程中学习,也无法适配工作流程需求。

研究数据还揭示了企业在资源分配上的错位:超过一半的生成式人工智能预算用于销售与营销工具,但麻省理工学院发现,后台工作自动化的投资回报率最高——通过取消业务流程外包、削减外部机构成本以及优化运营流程实现。

成功的人工智能部署背后有哪些关键因素?

企业的人工智能应用方式至关重要。从专业供应商处采购人工智能工具并建立合作关系的模式,成功率约为67%;而企业内部自主开发的成功率仅为前者的三分之一。

这一发现对金融服务及其他受严格监管的行业而言尤为关键——2025年,这些领域的许多企业都在自主研发专属生成式人工智能系统。然而,麻省理工学院的研究表明,企业独自开展开发工作时遭遇失败的概率要高得多。

查拉帕利指出,受访企业往往不愿透露失败率。“几乎所有我们调研的企业,都曾尝试自主开发工具。”他说道,但数据显示,采购解决方案能带来更为可靠的结果。

其他促成成功的关键因素包括:赋予业务经理(而非仅依赖中央人工智能实验室)推动人工智能应用的权力,以及挑选能够深度集成且随时间推移不断适应的工具。

劳动力结构调整已然启动,尤其涉及客户支持与行政岗位。企业不再沿袭过往大规模裁员的模式,而是愈发倾向于在职位出现空缺时选择不再填补。大多数变革集中在此前因被视为低价值而外包的岗位。

报告还强调了“影子人工智能”(指ChatGPT等未获企业授权的工具)的广泛应用,以及“衡量人工智能对生产力与利润的影响”这一持续存在的难题。

展望未来,最前沿的企业已开始试验智能体人工智能系统——这类系统能够在设定范围。(*)

译者:中慧言-王芳

Good morning. Companies are betting on AI—yet nearly all enterprise pilots are stuck at the starting line.

The GenAI Divide: State of AI in Business 2025, a new report published by MIT’s NANDA initiative, reveals that while generative AI holds promise for enterprises, most initiatives to drive rapid revenue growth are falling flat.

Despite the rush to integrate powerful new models, about 5% of AI pilot programs achieve rapid revenue acceleration; the vast majority stall, delivering little to no measurable impact on P&L. The research—based on 150 interviews with leaders, a survey of 350 employees, and an analysis of 300 public AI deployments—paints a clear divide between success stories and stalled projects.

To unpack these findings, I spoke with Aditya Challapally, the lead author of the report, and a research contributor to project NANDA at MIT.

“Some large companies’ pilots and younger startups are really excelling with generative AI,” Challapally said. Startups led by 19- or 20-year-olds, for example, “have seen revenues jump from zero to $20 million in a year,” he said. “It’s because they pick one pain point, execute well, and partner smartly with companies who use their tools,” he added.

But for 95% of companies in the dataset, generative AI implementation is falling short. The core issue? Not the quality of the AI models, but the “learning gap” for both tools and organizations. While executives often blame regulation or model performance, MIT’s research points to flawed enterprise integration. Generic tools like ChatGPT excel for individuals because of their flexibility, but they stall in enterprise use since they don’t learn from or adapt to workflows, Challapally explained.

The data also reveals a misalignment in resource allocation. More than half of generative AI budgets are devoted to sales and marketing tools, yet MIT found the biggest ROI in back-office automation—eliminating business process outsourcing, cutting external agency costs, and streamlining operations.

What’s behind successful AI deployments?

How companies adopt AI is crucial. Purchasing AI tools from specialized vendors and building partnerships succeed about 67% of the time, while internal builds succeed only one-third as often.

This finding is particularly relevant in financial services and other highly regulated sectors, where many firms are building their own proprietary generative AI systems in 2025. Yet, MIT’s research suggests companies see far more failures when going solo.

Companies surveyed were often hesitant to share failure rates, Challapally noted. “Almost everywhere we went, enterprises were trying to build their own tool,” he said, but the data showed purchased solutions delivered more reliable results.

Other key factors for success include empowering line managers—not just central AI labs—to drive adoption, and selecting tools that can integrate deeply and adapt over time.

Workforce disruption is already underway, especially in customer support and administrative roles. Rather than mass layoffs, companies are increasingly not backfilling positions as they become vacant. Most changes are concentrated in jobs previously outsourced due to their perceived low value.

The report also highlights the widespread use of “shadow AI”—unsanctioned tools like ChatGPT—and the ongoing challenge of measuring AI’s impact on productivity and profit.

Looking ahead, the most advanced organizations are already experimenting with agentic AI systems that can learn, remember, and act independently within set boundaries—offering a glimpse at how the next phase of enterprise AI might unfold.

*