越来越怀疑,很多 Agent 现在根本进不了企业
最近这段时间,我一直在做 Agent Runtime 。然后越做越发现一个问题。
现在很多 Agent Demo ,看起来真的很猛。
会规划。
会调用 Tool 。
会 MCP 。
会 Multi-Agent 。
还能自己拆任务。
但问题是。
这些东西很多时候只适合 Demo 。
一旦真的开始接企业里的系统,问题马上就开始出现。
比如:
一个长任务执行 20 分钟之后,上下文乱了怎么办?
多个 Agent 同时修改状态,memory 冲突怎么办?
AI 调错 Tool 了怎么办?
任务执行到一半挂了,怎么恢复?
企业里的权限怎么隔离?
出了问题之后,怎么审计?
这些问题其实都不是 Prompt 能解决的。
甚至很多都已经不是“大模型问题”。
而是 Runtime 问题。
我现在越来越觉得,现在很多人其实高估了 Agent 的“智能”,但低估了 Agent 真正进入生产环境的难度。
因为 AI 一旦开始真正“做事”,而不是聊天,它碰到的问题会越来越像:
分布式系统
状态机
调度系统
工作流引擎
权限系统
而不是 Prompt Engineering 。
所以我最近在做的东西,核心已经不是“怎么让 Agent 更聪明”。
反而是:
怎么让 Agent 不失控。
现在我的思路有点像:
Runtime 负责管理。
Agent 负责干活。
用户请求进来之后,Runtime 先做路由,再把任务交给不同领域的“数字员工”。
每个员工只负责自己领域内的事情。
然后 Runtime 去解决:
权限
memory
调度
sandbox
状态恢复
多 Agent 协同
Human-in-the-loop
这些问题。
我现在甚至有一种感觉。
未来企业真正需要的,可能根本不是一个“超级 Agent”。
而是一套稳定的数字员工系统。
而真正难的部分,也不是模型。
而是 Runtime 。 写的好好。 感觉现在人在充当着这个 runtime 的角色。我有一个类似问题的想法,还在实现中…… 有多少人工才有多少智能。agent 需要由 agent 工程师让他变得好用。 两个顶级模型来回修正,效果比人工好 这不就是他们说的 harness 问题已经从使用大模型,上升到软件工程问题了 不是有人么?
企业上这东西的意义是让一个人可以干原来五个人的活,而不是上了之后不要人了 多数企业要的是一个“稳定可靠的系统”+“AI 叙事”+“轻量化 AI 应用”,这样才能赶上互联网潮流,坑钱骗投资骗预算,见多了
页:
[1]