什么是分组
分组用于控制 API 令牌可以访问的模型、渠道和价格规则。不同分组对应不同的模型路由和计费规则。分组配置
创建 API 令牌时选择一个或多个分组。当前常见分组:| 分组 | 适用客户端 | 说明 |
|---|---|---|
auto | 不确定路由时的默认选择 | 按当前路由配置在可用具体分组中选择;默认使用价格较高但稳定可靠的 openai 和 anthropic 分组,适合快速验证,长期使用建议切换到具体分组 |
openai | OpenAI SDK、OpenAI 兼容客户端 | GPT、Responses、图片等 OpenAI 兼容模型 |
anthropic | Anthropic SDK、Claude Messages | Claude Messages 格式 |
claude-bedrock | Claude Code、Claude 客户端 | AWS Bedrock Claude 路由;价格较高但运行稳定,支持 prompt caching |
claude-kiro | Claude Code、Kiro 兼容场景 | Kiro 逆向 Claude 路由;价格较低但偶尔会因额度耗尽中断(需管理员手动补充),且由于渠道限制无法命中 cache |
codex | Codex CLI | 网关中转,兼容性优先 |
codex-passthrough | Codex CLI | 直通、低延迟,仅限 CLI 场景 |
codex-cheap | Codex CLI | |
codex-cheap-passthrough | Codex CLI | |
gemini | Gemini CLI、Google SDK | Gemini API 格式 |
xai | Grok / xAI 模型 | xAI 路由 |
doubao | 豆包模型 | 字节模型路由 |
opensource | 开源模型 | 标准价开源模型 |
opensource-discount | 开源模型 | 折扣价开源模型 |
opensource-economy | 开源模型 | 经济价开源模型 |
opensource-highquality | 开源模型 | 高质量开源模型 |
分组名称、倍率和可用模型以控制台和
/api/pricing 返回结果为准。上表是当前线上服务中用户可见的分组快照。分组与模型路由
AIOHub 根据 API 令牌的分组和请求中的模型名称,自动路由到对应的模型服务商。同一个模型在不同分组中可能有不同的渠道和价格。使用建议
- 为每个客户端创建独立 API 令牌,便于按工具追踪用量日志和额度
- 不确定选哪个分组时,先使用
auto,再用/v1/models和小请求验证目标客户端、模型和端点 - Codex CLI 优先选择
codex、codex-passthrough或对应特价分组,不要放到通用 OpenAI 分组里验证 - 在控制台或模型定价页查看各分组支持的模型列表
注意事项
Claude Code 开启 1M 上下文
Claude Code 开启 1M 上下文
部分 Claude 模型原生就是 1M 上下文(如
claude-opus-4-7),使用这些模型时无需额外配置。但对于默认上下文不是 1M 的模型(如 claude-opus-4-6),如果你需要 1M 长上下文能力,需要在 Claude Code 应用内将模型改为 opus[1m]——即在模型名称后加 [1m] 后缀。不加后缀则使用默认的较短上下文窗口。不要通过问模型来确认模型名称或上下文长度
不要通过问模型来确认模型名称或上下文长度
在 Claude Code 中直接问模型「你是什么模型」或「你的上下文窗口是多少」,得到的回答不一定准确。模型是在训练完成之后才被命名和分配上下文规格的,模型本身并不可靠地「知道」自己的名称或参数——这类回答属于模型幻觉。如需确认实际使用的模型和上下文长度,请以客户端显示的模型标识或 AIOHub 控制台日志中的记录为准。
Kiro 与 PDF 文件支持
Kiro 与 PDF 文件支持
Kiro 不原生支持 PDF 格式输入。当你尝试让 Kiro 读取 PDF 时,模型通常会尝试调用本地工具将 PDF 转为文本再处理(类似 Cherry Studio 等客户端的做法),如果本地环境不具备转换能力则会报错。如果你需要在对话中直接处理 PDF 文件,建议使用
claude-bedrock 分组——AWS Bedrock 原生支持 PDF 格式作为输入,无需额外转换步骤。