首页
论坛首页
最近更新
最近更新
总版规
登录
立即注册
UID商城首页
大话之王
积分商城
积分银行
勋章中心
认证中心
尘火论坛 | 精品资源分享社区
»
首页
›
资源综合
›
尘火茶馆
›
Qwen3.5-Sonnet-9B: 专为 Coding Agent 蒸馏的 9B 小模 ...
返回列表
发布新帖
查看:
169
|
回复:
6
Qwen3.5-Sonnet-9B: 专为 Coding Agent 蒸馏的 9B 小模型
酒话
当前离线
UID
1327
幼儿园, 积分 446, 距离下一级还需 1054 积分
买家信用
卖家信用
酒话
发表于 2026-5-16 15:57:03
|
查看全部
|
阅读模式
最近炼了一个小模型放出来给大家玩,专门针对 OpenCode (还有 Claude Code )做了蒸馏。
FP8 量化后权重大概 13GB ,单张 24GB 显卡用 vLLM 就能跑 200K 上下文。
核心目标:claude 的风格,降低 tool call 的失败率,让 agent 能跑更长的连续任务。
蹲一下:Bug 反馈、奇怪的 trace 、改进建议都欢迎 🙏
🤗 HF: Qwen3.5-Sonnet-9B
回复
使用道具
举报
abcde
当前离线
UID
1328
幼儿园, 积分 350, 距离下一级还需 1150 积分
买家信用
卖家信用
abcde
发表于 2026-5-16 15:57:05
|
查看全部
22G 可以用吗?
回复
使用道具
举报
Aven
当前离线
UID
1080
银河会员, 积分 2066, 距离下一级还需 434 积分
买家信用
卖家信用
Aven
发表于 2026-5-16 16:17:03
|
查看全部
好奇有做效果测试和对比吗 另外有考虑提供更近一步的量化和苹果环境的权重嘛
回复
使用道具
举报
2367225475
当前离线
UID
1307
幼儿园, 积分 1245, 距离下一级还需 255 积分
买家信用
卖家信用
2367225475
发表于 2026-5-16 16:55:05
|
查看全部
@zhang666 试了下,19.5GB 显存可以跑 100K 的 context 长度
回复
使用道具
举报
帆帆
当前离线
UID
1011
小学生, 积分 2162, 距离下一级还需 338 积分
买家信用
卖家信用
帆帆
发表于 2026-5-16 17:22:09
|
查看全部
@kuhung 还在跑,ifeval (指令跟随) 和 gpqa_diamond (通用知识)没有弱化。我提供的权重是 hugging face 的标准 fp8 ,不是很熟悉苹果权重,可能会做~
回复
使用道具
举报
甜梗贩卖机
当前离线
UID
1069
小学生, 积分 2088, 距离下一级还需 412 积分
买家信用
卖家信用
甜梗贩卖机
发表于 2026-5-16 17:55:05
|
查看全部
好奇,这种和 gemma4 26b a3b 的 iq4xs 量化这种对比哪个好,尺寸可以说一样大。
回复
使用道具
举报
Eiro
当前离线
UID
1076
小学生, 积分 1965, 距离下一级还需 535 积分
买家信用
卖家信用
Eiro
发表于 2026-5-17 12:25:05
|
查看全部
@tootfsg 跑分的话确实 30Bx4bit 高于 15Bx8bit 。但是实际体验其实不好,高峰期感觉到的那种模型降智,基本就是低精度量化版本的锅
回复
使用道具
举报
返回列表
发布新帖
懒得打字嘛,点击右侧快捷回复
选择快捷回复
感谢分享,正需要
这东西我收了!谢谢楼主!
我看不错噢 谢谢楼主!
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!
其实我一直觉得楼主的品味不错!呵呵!
感谢楼主的无私分享!
楼主,大恩不言谢了!
楼主,我太崇拜你了!
社区不能没有像楼主这样的人才啊!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
×
CHLT Reply Guard
!
疑似灌水内容未提交
系统检测到这次发表内容信息量过低,已经先帮你拦下来了。
建议补充完整观点、问题、经历或上下文后再提交,这样更容易通过。
返回修改内容
快速回复
返回顶部
返回列表