モデルリダイレクト

モデルリダイレクト機能により、クライアントコードを変更することなく、リクエスト内のモデル名を他のモデルに透過的にマッピングし、バージョン管理、柔軟な切り替え、アクセス制御を実現できます。

コア価値

🔄

バージョン管理

モデルバージョンを一元管理し、ワンクリックでグローバルに使用されるモデルバージョンを切り替え

🔀

柔軟な切り替え

異なるプロバイダーや同等の能力を持つモデル間で自由に切り替え、ビジネスの継続性を維持

🏷️

命名の簡素化

複雑なモデルバージョン番号に覚えやすいエイリアスを作成

🔒

アクセス制御

ホワイトリストモードで利用可能なモデル範囲を厳密に制限

設定ガイド

設定場所

  1. GPT-Load管理コンソールにログイン
  2. 「グループ管理」ページに移動
  3. 対象グループの「編集」ボタンをクリック
  4. フォーム内の「モデルリダイレクトルール」設定エリアを探す

設定フォーマット

⚠️ 重要な注意事項

JSON設定で、keyはユーザーが利用可能なモデル名(リダイレクト後)、valueはアップストリームにリクエストされる実際のモデル名です

{
  "gpt-4": "gpt-4-turbo-2024-04-09",
  "gpt-4o": "gpt-4o-2024-05-13",
  "claude-opus": "claude-3-opus-20240229"
}

設定効果:

  • クライアントがgpt-4をリクエスト → 実際にはgpt-4-turbo-2024-04-09を呼び出し
  • クライアントがgpt-4oをリクエスト → 実際にはgpt-4o-2024-05-13を呼び出し
  • クライアントがgpt-3.5-turboをリクエスト → 直接パススルー(設定されていない)

ポリシーモード

ルーズモード(デフォルト)

設定されたモデルはリダイレクトされ、設定されていないモデルはアップストリームサービスにパススルーされます。一般的なプロキシシナリオに適しており、最大限の互換性を維持します。

設定ルール:{"gpt-4": "gpt-4-turbo"}

gpt-4 → gpt-4-turbo(リダイレクト)

gpt-3.5-turbo → gpt-3.5-turbo(パススルー)

claude-3 → claude-3(パススルー)

ストリクトモード

設定ルール内のソースモデル名のみを許可し、設定されていないモデルリクエストは400エラーを返します。ホワイトリスト制御と厳格なコスト管理に適しています。

設定ルール:{"allowed-model": "gpt-4-turbo"}

allowed-model → gpt-4-turbo(リダイレクト)

gpt-4 → 400エラー ❌

gpt-3.5-turbo → 400エラー ❌

典型的なユースケース

シナリオ1:統一モデルバージョン管理

社内の複数のプロジェクトがgpt-4を使用しており、最新バージョンに統一してアップグレードする必要があります。プロジェクトコードを変更する必要なく、プロキシレイヤーでバージョンを一元的に切り替えます。

{
  "gpt-4": "gpt-4-turbo-2024-04-09",
  "gpt-4-32k": "gpt-4-turbo-2024-04-09"
}

シナリオ2:柔軟なプロバイダー切り替え

異なるプロバイダーの同等能力を持つモデル間で切り替え、または可用性や地域などの要因に基づいて動的に調整。シームレスな移行でビジネスの継続性を維持。

{
  "gpt-4": "claude-3-opus-20240229",
  "default-chat": "gemini-2.0-flash"
}

シナリオ3:短いエイリアスの作成

複雑なモデルバージョン番号を簡素化し、開発体験を向上させます。クライアントコードがよりクリーンになり、バージョンアップグレード時には設定のみを変更すれば済みます。

{
  "gpt5": "gpt-5-2025-08-07",
  "flash": "gemini-2.5-flash-preview",
  "opus": "claude-3-opus-20240229"
}

シナリオ4:集約グループモデル統一

集約グループが同じチャネルタイプだが異なるサービスプロバイダーに接続するサブグループを含む場合、各サブグループでモデルリダイレクトを設定し、クライアントが統一されたモデル名で異なるプロバイダーにアクセス可能。

サブグループA (OpenAI公式): {"gpt-4": "gpt-4-turbo"}
サブグループB (Azure OpenAI): {"gpt-4": "gpt-35-turbo"}
サブグループC (OpenRouter): {"gpt-4": "openai/gpt-4-turbo"}

重要な注意事項

設定制限

  • 集約グループ自体はモデルリダイレクトをサポートしていませんが、サブグループ(標準グループ)はサポートしています
  • 有効なJSON形式である必要があります
  • キーと値は空でない文字列である必要があります
  • 正規表現やワイルドカードはサポートされていません

使用推奨事項

  • 本番環境ではルーズモードを推奨
  • テスト環境ではストリクトモードでコスト管理
  • リダイレクトログを定期的に監査
  • 期限切れのリダイレクトルールを速やかにクリーンアップ

機能概要

モデルリダイレクトはリクエストチェーン内で透過的に実行され、クライアントには認識されません。設定はホットアップデートをサポートし、サービスの再起動なしで有効になります。

重要なポイント: JSON設定で、keyはユーザーが利用可能なモデル、valueはアップストリームの実際のモデルです