需要大概 500 亿 token,现在用什么方案比较好?
计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。
目前用的是 mimo CH.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。 别单算输入输出比,缓存率也得考虑啊 给个方向:租算力去自己推理? 中转站啊 推荐你用中转站的 gpt5.4 相对来说还是很便宜的 收雷总送的 mimo 额度呀,我 max plan 还有 900 亿 credit ,可出 来用中转站吧 看看我之前发的几个贴子,肯定能解决你的问题 中转呗。。当然自己买 Pro20 最划算。 中转呗。。当然自己买 Pro20 最划算。
页:
[1]
2