内容/林书
编辑/咏鹅
校对/莽夫
随着在复杂推理、多模态融合以及自主代理(Agent)能力上更强大的GPT-5发布,有人高呼“AI Agent时代真的来了”,也有人持谨慎态度,认为“GPT-5是对AI Agent创业者的洗牌”。
Part.1
繁荣下的结构性困境
AI Agent的“单点困局”与“组织鸿沟”
从总体来看,当前的AI Agent市场,缺乏能真正穿越周期的、展现出“Agent比人类更懂执行”的产品。
究其根源,在于当前的Agent类产品普遍面临着两个深层次的结构性问题:一是Agent类产品普遍为“单点”赋能;二则是相当多的企业,都将重心放在了打造所谓的“通用”功能上。
当前的大多数Agent产品,往往专注于优化单一任务或特定场景(如信息检索、报表生成、任务自动化),但缺乏对企业生产链条中多个环节的协同整合能力。这种“单点”赋能模式导致Agent在复杂、跨部门的业务流程中难以发挥“枢纽”作用。
造成这一现象的原因,既有技术上的短板,也有组织上的滞后。
从技术上来说,一部分Agent应用在技术上并不成熟,在执行涉及复杂逻辑、多步骤或调用多个工具的任务时,常出现卡顿、失败或耗时过长的问题。
以Manus为例,不少用户发现在测试中一旦任务涉及多个工具(如文件+邮件+ Notion +云盘),Manus就常常会在执行中卡住、步骤结果传递错误,或耗时超过一小时。这反映出了此类Agent应用缺少显式记忆机制,以至在多轮对话中状态信息经常丢失,甚至误用旧信息;或是各工具接口无统一协议,调用全靠prompt“蒙”。
而像扣子空间这样的产品,在进行“根据数据绘制图表”的任务时,完成的状态、质量也十分潦草,难以达到“合格”要求。
这说明现在相当一部分的Agent,基本只有一层prompt调用API,缺乏一整套结构化的、统一的数据接口,以及相应的推理链条。
而从组织结构上来说,当前很多企业实际上并未完成适应AI时代的“人机协作”转型。
一个明显的例子是,今年上半年,有相当一部分企业落地了编程类Agent应用cursor,但得到的反馈却是此类应用没有显著提效。
原因就在于,在企业的实际运作中,一段代码从写出来,到真正“用得上”,往往要经历需求澄清、任务拆解、代码开发、审核、测试等多个环节,涉及跨部门协调。
现在的问题不是Agent写得慢,而是企业没有把Agent“嵌进流程”中去。整条“软件交付流水线”仍然是人主导的、审批制的、串联式结构。
结果便是AI可能节省了20%的开发时间,但流程中60%的瓶颈根本不在编码环节,而在于组织流程和人为因素。这使得Agent带来的效率提升,在陈旧的“人治”流程面前几乎被完全抵消,全都化作了乌有。
Part.2
Agent分野
通用虚火噱头与垂类深耕挑战
现阶段,包括BAT、字节在内的大厂,都擅长做平台和demo,例如阿里的钉钉+夸克、百度的千帆App Builder等,但真正把复杂垂直业务完成端到端改造的案例并不多,大部分还是小规模试点或简单辅助。此外,很多企业做了大量POC(概念验证),但真正投入规模化使用的很少。
根据ThoughtWorks报告披露,因为业务协同不足与运营成本高,高达88%的AI POC未能进入大规模部署。研究发现,每家公司推出的33个AI概念验证项目中,只有4个能够进入生产阶段。
究其原因是互联网大厂更擅长做“通用能力+流量和平台”,而真正把垂类行业的脏活、定制、合规、实施做到位,则需要线下深耕与行业Know-How积累,这和它们的业务属性、考核体系和商业动力并不十分匹配。
Part.3
跨越市场鸿沟
出海抉择与本土价值验证