计费说明 - AIOHub Docs

计费方式

AIOHub 按实际用量计费，采用预充值扣费模式：

充值额度到账户
每次 API 调用按当前模型、端点和分组价格扣除对应费用
余额不足时请求会被拒绝

价格来源

不同模型和分组的价格不同。当前价格以控制台模型定价页和 /api/pricing 返回结果为准，返回内容包含模型价格、分组倍率、可用分组和支持的端点类型。

不要把某个静态文档里的模型单价当作长期价格表。计费和可用性以调用发生时的控制台价格和扣费结果为准。

费用组成

每次 API 调用的费用可能由以下部分组成：

输入 Token：你发送给模型的文本
输出 Token：模型返回的文本
模型价格或倍率：不同模型可能按 Token 倍率计费，也可能按单次任务固定价格计费
分组倍率：同一模型在不同分组中可能有不同折扣或溢价
端点附加倍率：部分模型会区分缓存读写、图片、音频或其他端点相关用量

图片、视频、音频和任务型模型不一定都按文本 Token 计费。查看消费明细时，以控制台记录的扣费结果和返回的用量字段为准。

查看消费

在控制台可以查看：

控制成本

使用模型定价页比较同一模型在不同分组中的价格
为批量任务选择经济分组或特价分组，先用小请求验证可用性
控制单次请求的上下文长度
使用流式输出时注意中断未完成的请求也会计费

可用模型分组机制