a837660069 发表于 前天 17:24

阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……

gp500198 发表于 前天 18:25

因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。
页: [1]
查看完整版本: 阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?