越来越怀疑，很多 Agent 现在根本进不了企业

Yenzery 发表于前天 15:48

最近这段时间，我一直在做 Agent Runtime 。

然后越做越发现一个问题。

现在很多 Agent Demo ，看起来真的很猛。

会规划。
会调用 Tool 。
会 MCP 。
会 Multi-Agent 。
还能自己拆任务。

但问题是。

这些东西很多时候只适合 Demo 。

一旦真的开始接企业里的系统，问题马上就开始出现。

比如：

一个长任务执行 20 分钟之后，上下文乱了怎么办？

多个 Agent 同时修改状态，memory 冲突怎么办？

AI 调错 Tool 了怎么办？

任务执行到一半挂了，怎么恢复？

企业里的权限怎么隔离？

出了问题之后，怎么审计？

这些问题其实都不是 Prompt 能解决的。

甚至很多都已经不是“大模型问题”。

而是 Runtime 问题。

我现在越来越觉得，现在很多人其实高估了 Agent 的“智能”，但低估了 Agent 真正进入生产环境的难度。

因为 AI 一旦开始真正“做事”，而不是聊天，它碰到的问题会越来越像：

分布式系统

状态机

调度系统

工作流引擎

权限系统

而不是 Prompt Engineering 。

所以我最近在做的东西，核心已经不是“怎么让 Agent 更聪明”。

反而是：

怎么让 Agent 不失控。

现在我的思路有点像：

Runtime 负责管理。

Agent 负责干活。

用户请求进来之后，Runtime 先做路由，再把任务交给不同领域的“数字员工”。

每个员工只负责自己领域内的事情。

然后 Runtime 去解决：

权限

memory

调度

sandbox

状态恢复

多 Agent 协同

Human-in-the-loop

这些问题。

我现在甚至有一种感觉。

未来企业真正需要的，可能根本不是一个“超级 Agent”。

而是一套稳定的数字员工系统。

而真正难的部分，也不是模型。

而是 Runtime 。

1216009084 发表于前天 17:05

写的好好。感觉现在人在充当着这个 runtime 的角色。我有一个类似问题的想法，还在实现中……

1758580096aa 发表于前天 17:19

有多少人工才有多少智能。agent 需要由 agent 工程师让他变得好用。

活到老学到老 发表于前天 17:45

两个顶级模型来回修正，效果比人工好

15515536365 发表于前天 17:52

这不就是他们说的 harness

丿丶灵泽 发表于前天 18:00

问题已经从使用大模型，上升到软件工程问题了

Tani 发表于前天 18:05

不是有人么？
企业上这东西的意义是让一个人可以干原来五个人的活，而不是上了之后不要人了

2367225475 发表于前天 18:19

多数企业要的是一个“稳定可靠的系统”+“AI 叙事”+“轻量化 AI 应用”，这样才能赶上互联网潮流，坑钱骗投资骗预算，见多了

页: [1]

尘火论坛 | 精品资源分享社区's Archiver

越来越怀疑，很多 Agent 现在根本进不了企业