跳转到主要内容

计费方式

AIOHub 按实际用量计费,采用预充值扣费模式:
  1. 充值额度到账户
  2. 每次 API 调用按当前模型、端点和分组价格扣除对应费用
  3. 余额不足时请求会被拒绝

价格来源

不同模型和分组的价格不同。当前价格以控制台模型定价页和 /api/pricing 返回结果为准,返回内容包含模型价格、分组倍率、可用分组和支持的端点类型。
不要把某个静态文档里的模型单价当作长期价格表。计费和可用性以调用发生时的控制台价格和扣费结果为准。

费用组成

每次 API 调用的费用可能由以下部分组成:
  • 输入 Token:你发送给模型的文本
  • 输出 Token:模型返回的文本
  • 模型价格或倍率:不同模型可能按 Token 倍率计费,也可能按单次任务固定价格计费
  • 分组倍率:同一模型在不同分组中可能有不同折扣或溢价
  • 端点附加倍率:部分模型会区分缓存读写、图片、音频或其他端点相关用量
图片、视频、音频和任务型模型不一定都按文本 Token 计费。查看消费明细时,以控制台记录的扣费结果和返回的用量字段为准。

查看消费

在控制台可以查看:

控制成本

  • 使用模型定价页比较同一模型在不同分组中的价格
  • 为批量任务选择经济分组或特价分组,先用小请求验证可用性
  • 控制单次请求的上下文长度
  • 使用流式输出时注意中断未完成的请求也会计费