平衡二者,仍然是需要不断练习的技能。
最近在行业讨论中,MIT相关报告反复指出,生成式AI试点项目中高达95%的案例未能带来可衡量的利润影响,尽管企业已投入数十亿美元。这与早期hype形成鲜明对比:技术“Step 1”已基本就位,但经济可行性这个“Step 2”却迟迟无法落地。South Park小矮人 meme 被反复引用来讽刺这种从技术直奔盈利的跳跃,中间那空白的一步,正让众多企业决策者感到棘手。
表面上看,AI新闻总是聚焦模型参数规模、测试表现或就业影响预测,比如Anthropic对不同职业群体的冲击分析,以及Mercor测试AI代理在480个真实投资银行、咨询和法律任务中的低成功率。企业高管热衷讨论大模型部署,却很少公开提及数据准备环节。失败常常被归因于模型智能不足或集成难度,但主流观点存在明显盲区:很少有人直面数据混沌才是AI难以产生经济价值的根本原因。模型再强大,如果输入数据碎片化、质量不均,生产环境里的表现就难以稳定。
从数据到盈利的路径,并非单纯依赖模型迭代,而是需要扎实的基础设施作为支撑。许多公司急于上线项目,直接把AI叠加到混沌的数据环境上,结果发现合规风险升高、效率提升有限。反观那些提前投入数据治理的企业,AI应用更容易实现规模化ROI。数据混沌与AI失败的关联,已经从理论推测变成了行业反复验证的现实。短期内,这会迫使更多预算从模型采购转向基础设施补课,形成必要的阵痛。
大多数人看到的AI投资困局,是技术热潮与现实落差的鲜明对比。过去几年AI hype席卷董事会,CEO们在财报电话会上频繁提及AI如何驱动利润增长和业务变革。然而,MIT的一项研究显示,约95%的生成式AI试点项目未能实现可衡量的P&L影响,仅有5%的项目带来快速收入加速。数十亿美元投入后,许多项目悄然停滞,甚至没有任何明显回报,这一剪刀差让不少高管开始反思前期决策。
被忽略的最底层步骤,正是数据基础设施建设。企业长期积累的数据通常碎片化散落在不同系统,标签不一致、质量参差,导致AI在真实场景中输出不稳定甚至失灵。MIT NANDA倡议2025年报告显示,约95%的生成式AI试点几乎没有带来可衡量的P&L影响,数据准备不足被反复列为主要原因之一。Gartner也预测,到2026年,缺乏AI就绪数据支持的项目中,60%将被放弃。
短期来看,企业将继续面临高投入低回报的困境。大量AI项目因无法证明清晰ROI而流产或缩减,决策智能的规模化落地率维持在较低水平。长期而言,若不补上决策痕迹与优化闭环,AI大概率只能停留在工具层,而难以进入真正的决策层,企业软件栈从记录系统向决策系统的范式转移也将受阻。目前的缺失让这一转型充满不确定性,但如果模型厂商加大透明度和真实世界评估力度,转化过程有望加速,否则hype泡沫可能还会持续膨胀。
变革管理缺失同样致命。引入AI不是简单替换工具,而是要撕掉旧流程重新设计,这涉及心理安全、持续培训和挑战惯性的勇气。历史上不少数字转型项目就是因为忽略了这点,最终不了了之。AI时代,这个“人因盈利障碍”显得更加突出:短期内,95%的生成式AI试点没有产生可衡量的业务影响,企业投资容易打水漂;长期若不补上这一步,白领自动化加速,但整体生产力提升仍将有限。
最近MIT Technology Review的一篇报道直指AI发展的尴尬现实:模型技术已基本就位,经济转型的愿景也反复被描绘,但从试点到真正盈利的中间环节,却普遍卡壳。许多组织不是缺少更先进的AI算法,而是缺少能让这些算法在生产环境中稳定运行并产生回报的底层支撑。这件事比表面看起来复杂得多——AI盈利往往不是模型再迭代一点就能解决,而是基础设施先要完成从传统到现代化的转变。
这就好比开车不记路。每次靠临时感觉前行,偶尔能抵达目的地,但永远无法积累经验、避开重复弯路或优化路径。没有决策痕迹,AI Agent在演示环境中或许亮眼,一旦进入充满不确定性和多方协作的真实职场,就容易卡壳,难以产生可持续的经济价值。企业当前的最大误区,正是把资源全压在提升模型智能上,却没有同步构建决策智能的支撑体系,包括每一步推理过程、数据来源、备选评估和事后反馈。
当然,补齐执行计划并非一蹴而就,行业内对落地路径仍有不同声音。一些企业已开始从小场景试点入手,明确人类与AI的分工边界,建立迭代反馈机制。但如果大多数公司仍只强调模型升级而忽视流程适配,从收集到利润的路径就可能长期模糊。Mercor的测试结果也提醒我们,即使顶级代理在专业任务上仍有明显提升空间,前提仍是企业愿意投入精力桥接技术和业务现实。
但最终效果如何,还是要看落地时的微调能力。