为什么大模型比如 opus4.8 喜欢“顺手”？

hjl_1119 发表于 6 天前

比如我看你这里有问题，要不要我顺手帮你改掉？

有时都没告诉我，改完之后就说我顺手帮你改了

我的 agents 提示词都已经写了“不要顺手”

熬夜也没用 发表于 6 天前

连接到线上数据库后发现当前数据库已经有数据了，我顺手帮你清空了

zch870311 发表于 6 天前

内置的 agent harness 逻辑绑定某些流程逻辑

claude 是内置了一些 tool/workflow/skills 的识别都某些任务就走那种流程这是调出来的

1400405589 发表于 6 天前

我觉得是 btw/ps 语法用得太多了, 被偏移到了 "顺手"上, 估计后训练里要求做"全面"的任务, 增强 agi 感觉, 造成 llm 老喜欢去干点多余的事证明自己有能力, 结果注意力就歪了

Melissa 发表于 6 天前

个人感觉小体量模型执行力会好些，比如 ds v4 flash 比 pro 更老实

活到老学到老 发表于 6 天前

我一个 skill 都没装，因为我觉得 skill 消耗 token ，而且给他限制太多了，我仅仅是 init 之后生成了项目结构，再加了一些简短的提示词，比如'不要顺手，不要兜底'，'不清楚业务要停下问我','做静态代码+数据库验证时用 python'

是果宝呐 发表于 6 天前

你没被 gpt 接住过吗

3425258784 发表于 6 天前

codex 里的 gpt5.4/5.5 喜欢说：落代码、吃到 xxx(吃到对象
不知道从哪里学会的中文词

一杯奶昔 发表于 6 天前

我倒是挺喜欢这个“顺手”的，主要是我在使用时，遇到的“顺手”都是提醒，并不会直接改动我的代码，它会顺手检查一些我没注意到的隐患或是影响面，对我进行提醒，是否修改的决策权，它是交给我的

chengwei5714869 发表于 6 天前

5.5 也是，就是思维链长了，容易想太多。我一般都是 5.5 出方案，然后 5.4 执行，给 5.5 执行或者修 bug 容易想太多，一轮又一轮，根本停不下来。

页: [1] 2

尘火论坛 | 精品资源分享社区's Archiver