首页
论坛首页
最近更新
最近更新
总版规
登录
立即注册
UID商城首页
大话之王
积分商城
积分银行
勋章中心
认证中心
尘火论坛 | 精品资源分享社区
»
首页
›
资源综合
›
尘火茶馆
›
Gemma4 12b 居然比 Qwen3.5 9b 还快,意料不到 ...
返回列表
发布新帖
查看:
43
|
回复:
1
Gemma4 12b 居然比 Qwen3.5 9b 还快,意料不到
1758580096aa
当前离线
UID
1197
幼儿园, 积分 790, 距离下一级还需 710 积分
买家信用
卖家信用
1758580096aa
发表于
7 天前
|
查看全部
|
阅读模式
显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑?
llama-server.exe ^
--model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^
--mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^
--model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^
--spec-type draft-mtp --spec-draft-n-max 3 ^
--spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^
--n-gpu-layers-draft 999 ^
--cache-type-k q4_0 ^
--cache-type-v q4_0 ^
--n-gpu-layers 999 ^
--no-mmap ^
--cache-prompt ^
--mlock ^
--kv-unified ^
--parallel 1 ^
-fa on ^
--fit off ^
--ctx-size 100000 --n-predict 10000 ^
--host 0.0.0.0 --port 11432
回复
使用道具
举报
小鹿酱
当前离线
UID
1018
初中生, 积分 2540, 距离下一级还需 960 积分
买家信用
卖家信用
小鹿酱
发表于
6 天前
|
查看全部
因为 gemma4 12B 有 48 层,qwen3.5 9B 只有 32 层。层深度决定了逻辑的缜密性。
回复
使用道具
举报
返回列表
发布新帖
懒得打字嘛,点击右侧快捷回复
选择快捷回复
感谢分享,正需要
这东西我收了!谢谢楼主!
我看不错噢 谢谢楼主!
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!
其实我一直觉得楼主的品味不错!呵呵!
感谢楼主的无私分享!
楼主,大恩不言谢了!
楼主,我太崇拜你了!
社区不能没有像楼主这样的人才啊!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
浏览过的版块
单机游戏
×
CHLT Reply Guard
!
疑似灌水内容未提交
系统检测到这次发表内容信息量过低,已经先帮你拦下来了。
建议补充完整观点、问题、经历或上下文后再提交,这样更容易通过。
返回修改内容
快速回复
返回顶部
返回列表