12
返回列表 发布新帖
楼主: 哎哟你干嘛

Opus 4.8 真的好难用!

Lntano发表于 前天 19:32 来自手机版 | 查看全部
如果不加约束的话,日文、韩文、中文、英文会变来变去……
不如 4.6 + 1
回复

使用道具 举报

2316755307发表于 前天 19:48 来自手机版 | 查看全部
简单任务用 pi + deepseek 之后, 对比之下 claude code 太太太慢了
回复

使用道具 举报

Arrogants发表于 前天 20:11 来自手机版 | 查看全部
再补充个我遇到几次的 bug:模型有时会输出一大堆 tool calls ,但是不输出 finish 。于是从 API 角度来说,响应一直在进行,不给客户端返回结果的机会,模型就拿不到执行命令的结果。

而 Opus 4.8 会出现幻觉,认为自己拿到了空白输出,于是就能看到这种奇观:

================
(前略)

$ grep -R xxx ./

thinking: 奇怪,grep 没有返回任何结果,让我测试 Bash 工具是否正常。

$ ls -l .

$ echo ok

$ echo ====probing====

$ printf "yes\n"

$ echo PROBING_OK

thinking: 依然没有任何输出,Bash 工具可能存在问题。我需要向用户解释当前的工具状况。
回复

使用道具 举报

z648843411发表于 前天 20:26 来自手机版 | 查看全部
我的体验是 4.7 不如 4.6 ,4.7 很恶心的点是输出中文时(文档、注释等地方)经常出现一些很不常用,很奇怪的词汇表达(「当前」->「目下」、「继续」->「续行」、「重新生成」->「再演」等)。以及某些词汇会出现像火星文一样,看字形能看出意思但是文字被替换的情况。我用的是 cursor 内的模型,模型肯定是正确的,感觉像是官方为了反蒸馏做了什么处理...
4.8 用下来基本没出现 4.7 的这种情况,但是整体的体验下来和 4.6 、4.7 没有明显的大提升。
回复

使用道具 举报

̶A̶i̶r̶发表于 前天 20:32 来自手机版 | 查看全部
还在用 4.6
回复

使用道具 举报

未命名发表于 前天 20:59 来自手机版 | 查看全部
大模型瓶颈时代来了
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表