首页
论坛首页
最近更新
最近更新
总版规
登录
立即注册
UID商城首页
大话之王
积分商城
积分银行
勋章中心
认证中心
尘火论坛 | 精品资源分享社区
»
首页
›
资源综合
›
尘火茶馆
›
消费级显卡(16G A 卡)是不是不适合运行 vllm 和 sglang ...
返回列表
发布新帖
查看:
121
|
回复:
6
消费级显卡(16G A 卡)是不是不适合运行 vllm 和 sglang,好像使用 transformer 推理都
cc卡布达
当前离线
UID
1293
小学生, 积分 1741, 距离下一级还需 759 积分
买家信用
卖家信用
cc卡布达
发表于
3 天前
|
查看全部
|
阅读模式
如题,wsl 配 rocm 下,sglang 没跑起来,vllm 跑起来了,但是动不动爆显存,只有跑个 2b 的模型才比较稳定,而且推理首字速度体感感觉比纯用 transformer 还慢。
transformer 我试了可以成功跑个 9b 的 gptq 模型(vllm 这个模型跑不成功报错 qwen3.5 什么 config 有问题,claudecode 修不了),是我不会用 vllm 还是消费级显卡就是不适合用这类推理框架?
回复
使用道具
举报
ylw90731
当前离线
UID
1202
幼儿园, 积分 841, 距离下一级还需 659 积分
买家信用
卖家信用
ylw90731
发表于
3 天前
|
查看全部
rocm 还是原生 linux 效率高,我是 7900xtx
回复
使用道具
举报
Timo
当前离线
UID
1087
小学生, 积分 2044, 距离下一级还需 456 积分
买家信用
卖家信用
Timo
发表于
3 天前
|
查看全部
nv 的 3080m 这种魔改台式 16G ,16xx ,用了一年多还不错,就是寨都寨厂出品,驱动 nvcleanstall 就行
回复
使用道具
举报
smw1925281793
当前离线
UID
1257
小学生, 积分 2080, 距离下一级还需 420 积分
买家信用
卖家信用
smw1925281793
发表于
3 天前
|
查看全部
最近 sycl 生态也好起来了,估计 arc pro b70 要涨价了
回复
使用道具
举报
咕咕鸡
当前离线
UID
1036
小学生, 积分 2416, 距离下一级还需 84 积分
买家信用
卖家信用
咕咕鸡
发表于
3 天前
|
查看全部
这个东西.个人玩的话感觉不到爽.除非大力出奇迹.
我自己本地 3060 8G 搞了个 qwen2.7 玩了下.速度有 27T/S,.但是显存低.上下文长度也很低.输出速度倒是可以接受.基本不能用.这个东西没个 24G 以上基本就是纯折腾.
回复
使用道具
举报
dalongmao
当前离线
UID
1239
小学生, 积分 2087, 距离下一级还需 413 积分
买家信用
卖家信用
dalongmao
发表于
3 天前
|
查看全部
是的,消费级推荐 lm studio
回复
使用道具
举报
快乐小牛
当前离线
UID
1031
小学生, 积分 2209, 距离下一级还需 291 积分
买家信用
卖家信用
快乐小牛
发表于
前天 04:10
|
查看全部
RX9070 对标 Nvidia Titan V 的 AI 推理性能
回复
使用道具
举报
返回列表
发布新帖
懒得打字嘛,点击右侧快捷回复
选择快捷回复
感谢分享,正需要
这东西我收了!谢谢楼主!
我看不错噢 谢谢楼主!
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!
其实我一直觉得楼主的品味不错!呵呵!
感谢楼主的无私分享!
楼主,大恩不言谢了!
楼主,我太崇拜你了!
社区不能没有像楼主这样的人才啊!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
×
CHLT Reply Guard
!
疑似灌水内容未提交
系统检测到这次发表内容信息量过低,已经先帮你拦下来了。
建议补充完整观点、问题、经历或上下文后再提交,这样更容易通过。
返回修改内容
快速回复
返回顶部
返回列表