Yenzery 发表于 前天 15:48

越来越怀疑,很多 Agent 现在根本进不了企业

最近这段时间,我一直在做 Agent Runtime 。

然后越做越发现一个问题。

现在很多 Agent Demo ,看起来真的很猛。

会规划。
会调用 Tool 。
会 MCP 。
会 Multi-Agent 。
还能自己拆任务。

但问题是。

这些东西很多时候只适合 Demo 。

一旦真的开始接企业里的系统,问题马上就开始出现。

比如:

一个长任务执行 20 分钟之后,上下文乱了怎么办?

多个 Agent 同时修改状态,memory 冲突怎么办?

AI 调错 Tool 了怎么办?

任务执行到一半挂了,怎么恢复?

企业里的权限怎么隔离?

出了问题之后,怎么审计?

这些问题其实都不是 Prompt 能解决的。

甚至很多都已经不是“大模型问题”。

而是 Runtime 问题。

我现在越来越觉得,现在很多人其实高估了 Agent 的“智能”,但低估了 Agent 真正进入生产环境的难度。

因为 AI 一旦开始真正“做事”,而不是聊天,它碰到的问题会越来越像:

分布式系统

状态机

调度系统

工作流引擎

权限系统

而不是 Prompt Engineering 。

所以我最近在做的东西,核心已经不是“怎么让 Agent 更聪明”。

反而是:

怎么让 Agent 不失控。

现在我的思路有点像:

Runtime 负责管理。

Agent 负责干活。

用户请求进来之后,Runtime 先做路由,再把任务交给不同领域的“数字员工”。

每个员工只负责自己领域内的事情。

然后 Runtime 去解决:

权限

memory

调度

sandbox

状态恢复

多 Agent 协同

Human-in-the-loop

这些问题。

我现在甚至有一种感觉。

未来企业真正需要的,可能根本不是一个“超级 Agent”。

而是一套稳定的数字员工系统。

而真正难的部分,也不是模型。

而是 Runtime 。

1216009084 发表于 前天 17:05

写的好好。 感觉现在人在充当着这个 runtime 的角色。我有一个类似问题的想法,还在实现中……

1758580096aa 发表于 前天 17:19

有多少人工才有多少智能。agent 需要由 agent 工程师让他变得好用。

活到老学到老 发表于 前天 17:45

两个顶级模型来回修正,效果比人工好

15515536365 发表于 前天 17:52

这不就是他们说的 harness

丿丶灵泽 发表于 前天 18:00

问题已经从使用大模型,上升到软件工程问题了

Tani 发表于 前天 18:05

不是有人么?
企业上这东西的意义是让一个人可以干原来五个人的活,而不是上了之后不要人了

2367225475 发表于 前天 18:19

多数企业要的是一个“稳定可靠的系统”+“AI 叙事”+“轻量化 AI 应用”,这样才能赶上互联网潮流,坑钱骗投资骗预算,见多了
页: [1]
查看完整版本: 越来越怀疑,很多 Agent 现在根本进不了企业