为什么大模型比如 opus4.8 喜欢“顺手”?
比如我看你这里有问题,要不要我顺手帮你改掉?有时都没告诉我,改完之后就说我顺手帮你改了
我的 agents 提示词都已经写了“不要顺手” 连接到线上数据库后发现当前数据库已经有数据了,我顺手帮你清空了 内置 的 agent harness 逻辑 绑定某些流程逻辑
claude 是内置了一些 tool/workflow/skills 的 识别都某些任务 就走那种流程 这是调出来的 我觉得是 btw/ps 语法用得太多了, 被偏移到了 "顺手"上, 估计后训练里要求做"全面"的任务, 增强 agi 感觉, 造成 llm 老喜欢去干点多余的事证明自己有能力, 结果注意力就歪了 个人感觉小体量模型执行力会好些,比如 ds v4 flash 比 pro 更老实 我一个 skill 都没装,因为我觉得 skill 消耗 token ,而且给他限制太多了,我仅仅是 init 之后生成了项目结构,再加了一些简短的提示词,比如'不要顺手,不要兜底','不清楚业务要停下问我','做静态代码+数据库验证时用 python' 你没被 gpt 接住过吗 codex 里的 gpt5.4/5.5 喜欢说: 落代码、吃到 xxx(吃到对象
不知道从哪里学会的中文词 我倒是挺喜欢这个“顺手”的,主要是我在使用时,遇到的“顺手”都是提醒,并不会直接改动我的代码,它会顺手检查一些我没注意到的隐患或是影响面,对我进行提醒,是否修改的决策权,它是交给我的 5.5 也是,就是思维链长了,容易想太多。我一般都是 5.5 出方案,然后 5.4 执行,给 5.5 执行或者修 bug 容易想太多,一轮又一轮,根本停不下来。
页:
[1]
2