模型重定向
模型重定向功能允许您在不修改客户端代码的情况下,透明地将请求中的模型名称映射到其他模型,实现版本管理、灵活切换和访问控制。
核心价值
版本管理
统一管理模型版本,一键切换全局使用的模型版本
灵活切换
在不同供应商或相同能力的模型间自由切换,保持业务连续性
简化命名
为复杂的模型版本号创建易记的别名
访问控制
通过白名单模式严格限制可用模型范围
配置说明
配置位置
- 登录 GPT-Load 管理后台
- 进入「分组管理」页面
- 点击目标分组的「编辑」按钮
- 在表单中找到「模型重定向规则」配置区域
配置格式
⚠️ 重要说明
JSON 配置中,key 是用户可用的模型名称(重定向后),value 是请求上游的真实模型名称
{
"gpt-4": "gpt-4-turbo-2024-04-09",
"gpt-4o": "gpt-4o-2024-05-13",
"claude-opus": "claude-3-opus-20240229"
}配置效果:
- 客户端请求 gpt-4 → 实际调用 gpt-4-turbo-2024-04-09
- 客户端请求 gpt-4o → 实际调用 gpt-4o-2024-05-13
- 客户端请求 gpt-3.5-turbo → 直接透传(未配置规则)
策略模式
宽松模式(默认)
配置的模型进行重定向,未配置的模型直接透传到上游服务。适用于通用代理场景,保持最大兼容性。
配置规则:{"gpt-4": "gpt-4-turbo"}
gpt-4 → gpt-4-turbo(重定向)
gpt-3.5-turbo → gpt-3.5-turbo(透传)
claude-3 → claude-3(透传)
严格模式
仅允许配置规则中的源模型名称,未配置的模型请求返回 400 错误。适用于白名单控制和成本严格管控。
配置规则:{"allowed-model": "gpt-4-turbo"}
allowed-model → gpt-4-turbo(重定向)
gpt-4 → 400 错误 ❌
gpt-3.5-turbo → 400 错误 ❌
典型应用场景
场景一:模型版本统一管理
公司内部多个项目使用 gpt-4,需要统一升级到最新版本。无需修改各项目代码,在代理层统一切换版本。
{
"gpt-4": "gpt-4-turbo-2024-04-09",
"gpt-4-32k": "gpt-4-turbo-2024-04-09"
}场景二:供应商灵活切换
在不同供应商的相同能力模型间切换,或根据可用性、地域等因素动态调整。无缝迁移,保持业务连续性。
{
"gpt-4": "claude-3-opus-20240229",
"default-chat": "gemini-2.0-flash"
}场景三:创建简短别名
简化复杂的模型版本号,提升开发体验。客户端代码更简洁,版本升级时只需修改配置。
{
"gpt5": "gpt-5-2025-08-07",
"flash": "gemini-2.5-flash-preview",
"opus": "claude-3-opus-20240229"
}场景四:聚合分组模型统一
聚合分组包含多个相同渠道类型但对接不同服务商的子分组时,通过在每个子分组配置模型重定向,让客户端使用统一的模型名称访问不同服务商。
子分组A (OpenAI官方): {"gpt-4": "gpt-4-turbo"}
子分组B (Azure OpenAI): {"gpt-4": "gpt-35-turbo"}
子分组C (OpenRouter): {"gpt-4": "openai/gpt-4-turbo"}注意事项
配置限制
- • 聚合分组本身不支持模型重定向,但其子分组(标准分组)支持
- • 必须是有效的 JSON 格式
- • 键和值都必须是非空字符串
- • 不支持正则表达式或通配符
使用建议
- • 生产环境建议使用宽松模式
- • 测试环境可用严格模式控制成本
- • 定期审计重定向日志
- • 及时清理过期的重定向规则
功能总结
模型重定向在请求链路中透明执行,客户端感知不到映射过程。配置支持热更新,无需重启服务即可生效。