计费方式
AIOHub 按实际用量计费,采用预充值扣费模式:- 充值额度到账户
- 每次 API 调用按当前模型、端点和分组价格扣除对应费用
- 余额不足时请求会被拒绝
价格来源
不同模型和分组的价格不同。当前价格以控制台模型定价页和/api/pricing 返回结果为准,返回内容包含模型价格、分组倍率、可用分组和支持的端点类型。
不要把某个静态文档里的模型单价当作长期价格表。计费和可用性以调用发生时的控制台价格和扣费结果为准。
费用组成
每次 API 调用的费用可能由以下部分组成:- 输入 Token:你发送给模型的文本
- 输出 Token:模型返回的文本
- 模型价格或倍率:不同模型可能按 Token 倍率计费,也可能按单次任务固定价格计费
- 分组倍率:同一模型在不同分组中可能有不同折扣或溢价
- 端点附加倍率:部分模型会区分缓存读写、图片、音频或其他端点相关用量
查看消费
在控制台可以查看:控制成本
- 使用模型定价页比较同一模型在不同分组中的价格
- 为批量任务选择经济分组或特价分组,先用小请求验证可用性
- 控制单次请求的上下文长度
- 使用流式输出时注意中断未完成的请求也会计费