hjl_1119 发表于 6 天前

为什么大模型比如 opus4.8 喜欢“顺手”?

比如我看你这里有问题,要不要我顺手帮你改掉?

有时都没告诉我,改完之后就说我顺手帮你改了

我的 agents 提示词都已经写了“不要顺手”

熬夜也没用 发表于 6 天前

连接到线上数据库后发现当前数据库已经有数据了,我顺手帮你清空了

zch870311 发表于 6 天前

内置 的 agent harness 逻辑 绑定某些流程逻辑

claude 是内置了一些 tool/workflow/skills 的 识别都某些任务 就走那种流程 这是调出来的

1400405589 发表于 6 天前

我觉得是 btw/ps 语法用得太多了, 被偏移到了 "顺手"上, 估计后训练里要求做"全面"的任务, 增强 agi 感觉, 造成 llm 老喜欢去干点多余的事证明自己有能力, 结果注意力就歪了

Melissa 发表于 6 天前

个人感觉小体量模型执行力会好些,比如 ds v4 flash 比 pro 更老实

活到老学到老 发表于 6 天前

我一个 skill 都没装,因为我觉得 skill 消耗 token ,而且给他限制太多了,我仅仅是 init 之后生成了项目结构,再加了一些简短的提示词,比如'不要顺手,不要兜底','不清楚业务要停下问我','做静态代码+数据库验证时用 python'

是果宝呐 发表于 6 天前

你没被 gpt 接住过吗

3425258784 发表于 6 天前

codex 里的 gpt5.4/5.5 喜欢说: 落代码、吃到 xxx(吃到对象
不知道从哪里学会的中文词

一杯奶昔 发表于 6 天前

我倒是挺喜欢这个“顺手”的,主要是我在使用时,遇到的“顺手”都是提醒,并不会直接改动我的代码,它会顺手检查一些我没注意到的隐患或是影响面,对我进行提醒,是否修改的决策权,它是交给我的

chengwei5714869 发表于 6 天前

5.5 也是,就是思维链长了,容易想太多。我一般都是 5.5 出方案,然后 5.4 执行,给 5.5 执行或者修 bug 容易想太多,一轮又一轮,根本停不下来。
页: [1] 2
查看完整版本: 为什么大模型比如 opus4.8 喜欢“顺手”?