首页
论坛首页
最近更新
最近更新
总版规
登录
立即注册
UID商城首页
大话之王
积分商城
积分银行
勋章中心
认证中心
尘火论坛 | 精品资源分享社区
»
首页
›
资源综合
›
尘火茶馆
›
mac 64g 能部署哪个本地大模型
返回列表
发布新帖
查看:
147
|
回复:
7
mac 64g 能部署哪个本地大模型
lzp123
当前离线
UID
1331
幼儿园, 积分 333, 距离下一级还需 1167 积分
买家信用
卖家信用
lzp123
发表于 2026-6-3 10:33:04
|
查看全部
|
阅读模式
最近想在本地部属个 qwenpaw 用用。设备是 mac m4 64g 。想知道这个能部署哪个本地大模型 不太懂 纯请教
回复
使用道具
举报
快乐小牛
当前离线
UID
1031
小学生, 积分 2443, 距离下一级还需 57 积分
买家信用
卖家信用
快乐小牛
发表于 2026-6-3 11:25:06
|
查看全部
whichllm 我测了下不太准,top1 并非最佳选择。它提到的模型权重,你得细看不同量化,还要考虑 kv cache 预留一些空间。
回复
使用道具
举报
栀酒少女
当前离线
UID
1062
初中生, 积分 2521, 距离下一级还需 979 积分
买家信用
卖家信用
栀酒少女
发表于 2026-6-3 11:43:05
|
查看全部
你是 mac ,直接下个 oMLX ,下模型的时候会建议你用哪个。而且基本限制了 MLX 模型格式,对于 mac 更友好。
回复
使用道具
举报
qwe1831848900
当前离线
UID
1194
幼儿园, 积分 640, 距离下一级还需 860 积分
买家信用
卖家信用
qwe1831848900
发表于 2026-6-3 12:00:32
|
查看全部
我正好写过类似工具
如果是稠密模型
运行时显存需求 = 模型参数 x dtype(是什么量化版本) + 冗余量 留给 kv cache
如果是 moe 的模型
实际运行时显存需求 少于上面
用 13b 模型为例
格式 每参数字节 13B 权重
FP16/BF16 2B ~26 GB
FP8 (E4M3) 1B ~13 GB
NVFP4 0.5B ~7 GB
kv cache 按照 1/4 冗余计算
26 * 5/4
13 * 5/4
7 * 5/4
回复
使用道具
举报
独行
当前离线
UID
1039
小学生, 积分 2373, 距离下一级还需 127 积分
买家信用
卖家信用
独行
发表于 2026-6-3 12:24:04
|
查看全部
一般 小设备都跑 nvfp4 或者 fp8
mac fp8 的话 你大概跑 36 - 40+ 左右的差不多了 但可能你做其他功能就卡了
回复
使用道具
举报
2782186427
当前离线
UID
1315
幼儿园, 积分 1005, 距离下一级还需 495 积分
买家信用
卖家信用
2782186427
发表于 2026-6-3 13:30:06
|
查看全部
目前比较好的应该是 qwen3.6-35b-a3b 或 qwen3.6-27b
回复
使用道具
举报
Zuri
当前离线
UID
1081
小学生, 积分 2396, 距离下一级还需 104 积分
买家信用
卖家信用
Zuri
发表于 2026-6-3 18:35:08
|
查看全部
是 max pro 还是 ultra ?不一样的。
回复
使用道具
举报
xiaobin
当前离线
UID
1329
幼儿园, 积分 364, 距离下一级还需 1136 积分
买家信用
卖家信用
xiaobin
发表于 2026-6-3 19:35:09
|
查看全部
不建议个人电脑跑参数小的大语言模型,能跑但没什么卵用。1. 太慢了; 2. 太弱智了。
不如花点钱调用顶级模型的 API 。
回复
使用道具
举报
返回列表
发布新帖
懒得打字嘛,点击右侧快捷回复
选择快捷回复
感谢分享,正需要
这东西我收了!谢谢楼主!
我看不错噢 谢谢楼主!
既然你诚信诚意的推荐了,那我就勉为其难的看看吧!
其实我一直觉得楼主的品味不错!呵呵!
感谢楼主的无私分享!
楼主,大恩不言谢了!
楼主,我太崇拜你了!
社区不能没有像楼主这样的人才啊!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
浏览过的版块
单机游戏
×
CHLT Reply Guard
!
疑似灌水内容未提交
系统检测到这次发表内容信息量过低,已经先帮你拦下来了。
建议补充完整观点、问题、经历或上下文后再提交,这样更容易通过。
返回修改内容
快速回复
返回顶部
返回列表