モデルリダイレクト
モデルリダイレクト機能により、クライアントコードを変更することなく、リクエスト内のモデル名を他のモデルに透過的にマッピングし、バージョン管理、柔軟な切り替え、アクセス制御を実現できます。
コア価値
バージョン管理
モデルバージョンを一元管理し、ワンクリックでグローバルに使用されるモデルバージョンを切り替え
柔軟な切り替え
異なるプロバイダーや同等の能力を持つモデル間で自由に切り替え、ビジネスの継続性を維持
命名の簡素化
複雑なモデルバージョン番号に覚えやすいエイリアスを作成
アクセス制御
ホワイトリストモードで利用可能なモデル範囲を厳密に制限
設定ガイド
設定場所
- GPT-Load管理コンソールにログイン
- 「グループ管理」ページに移動
- 対象グループの「編集」ボタンをクリック
- フォーム内の「モデルリダイレクトルール」設定エリアを探す
設定フォーマット
⚠️ 重要な注意事項
JSON設定で、keyはユーザーが利用可能なモデル名(リダイレクト後)、valueはアップストリームにリクエストされる実際のモデル名です
{
"gpt-4": "gpt-4-turbo-2024-04-09",
"gpt-4o": "gpt-4o-2024-05-13",
"claude-opus": "claude-3-opus-20240229"
}設定効果:
- クライアントがgpt-4をリクエスト → 実際にはgpt-4-turbo-2024-04-09を呼び出し
- クライアントがgpt-4oをリクエスト → 実際にはgpt-4o-2024-05-13を呼び出し
- クライアントがgpt-3.5-turboをリクエスト → 直接パススルー(設定されていない)
ポリシーモード
ルーズモード(デフォルト)
設定されたモデルはリダイレクトされ、設定されていないモデルはアップストリームサービスにパススルーされます。一般的なプロキシシナリオに適しており、最大限の互換性を維持します。
設定ルール:{"gpt-4": "gpt-4-turbo"}
gpt-4 → gpt-4-turbo(リダイレクト)
gpt-3.5-turbo → gpt-3.5-turbo(パススルー)
claude-3 → claude-3(パススルー)
ストリクトモード
設定ルール内のソースモデル名のみを許可し、設定されていないモデルリクエストは400エラーを返します。ホワイトリスト制御と厳格なコスト管理に適しています。
設定ルール:{"allowed-model": "gpt-4-turbo"}
allowed-model → gpt-4-turbo(リダイレクト)
gpt-4 → 400エラー ❌
gpt-3.5-turbo → 400エラー ❌
典型的なユースケース
シナリオ1:統一モデルバージョン管理
社内の複数のプロジェクトがgpt-4を使用しており、最新バージョンに統一してアップグレードする必要があります。プロジェクトコードを変更する必要なく、プロキシレイヤーでバージョンを一元的に切り替えます。
{
"gpt-4": "gpt-4-turbo-2024-04-09",
"gpt-4-32k": "gpt-4-turbo-2024-04-09"
}シナリオ2:柔軟なプロバイダー切り替え
異なるプロバイダーの同等能力を持つモデル間で切り替え、または可用性や地域などの要因に基づいて動的に調整。シームレスな移行でビジネスの継続性を維持。
{
"gpt-4": "claude-3-opus-20240229",
"default-chat": "gemini-2.0-flash"
}シナリオ3:短いエイリアスの作成
複雑なモデルバージョン番号を簡素化し、開発体験を向上させます。クライアントコードがよりクリーンになり、バージョンアップグレード時には設定のみを変更すれば済みます。
{
"gpt5": "gpt-5-2025-08-07",
"flash": "gemini-2.5-flash-preview",
"opus": "claude-3-opus-20240229"
}シナリオ4:集約グループモデル統一
集約グループが同じチャネルタイプだが異なるサービスプロバイダーに接続するサブグループを含む場合、各サブグループでモデルリダイレクトを設定し、クライアントが統一されたモデル名で異なるプロバイダーにアクセス可能。
サブグループA (OpenAI公式): {"gpt-4": "gpt-4-turbo"}
サブグループB (Azure OpenAI): {"gpt-4": "gpt-35-turbo"}
サブグループC (OpenRouter): {"gpt-4": "openai/gpt-4-turbo"}重要な注意事項
設定制限
- • 集約グループ自体はモデルリダイレクトをサポートしていませんが、サブグループ(標準グループ)はサポートしています
- • 有効なJSON形式である必要があります
- • キーと値は空でない文字列である必要があります
- • 正規表現やワイルドカードはサポートされていません
使用推奨事項
- • 本番環境ではルーズモードを推奨
- • テスト環境ではストリクトモードでコスト管理
- • リダイレクトログを定期的に監査
- • 期限切れのリダイレクトルールを速やかにクリーンアップ
機能概要
モデルリダイレクトはリクエストチェーン内で透過的に実行され、クライアントには認識されません。設定はホットアップデートをサポートし、サービスの再起動なしで有効になります。