ルーティング戦略
GPT-Loadのパス処理メカニズムを理解し、柔軟なパス設定方法をマスターして、クライアントとアップストリームサービス間の正しい接続を確保する。
パス処理原理
透過原則
GPT-Loadは透過原則に従い、パス置換のみを担当し、最大限の柔軟性を維持します。コアロジックは、クライアントリクエスト内のプロキシプレフィックスを実際のアップストリームアドレスに置き換えることです。
置換ルール:GPT-Loadサービスアドレス + /proxy/ + グループ名 置換先 アップストリームアドレス
処理フロー例
サービスアドレス:
http://localhost:3001
アップストリームアドレス:
https://api.test.com
グループ名:
test
クライアントリクエスト
http://localhost:3001/proxy/test/v1/chat/completions
実際のリクエスト
https://api.test.com/v1/chat/completions
設定方法詳細
OpenRouterを例に(完全パス:https://openrouter.ai/api/v1/chat/completions)、グループ名がopenrouter、チャンネルタイプがopenai:
設定方法1:ドメイン分離
GPT-Load設定
アップストリームアドレス:
https://openrouter.ai
テストパス:
/api/v1/chat/completions
クライアント設定
Cherry Studio APIアドレス:
http://localhost:3001/proxy/openrouter/api
設定方法2:APIパスを含む(推奨)
GPT-Load設定
アップストリームアドレス:
https://openrouter.ai/api
テストパス:
/v1/chat/completions
クライアント設定
Cherry Studio APIアドレス:
http://localhost:3001/proxy/openrouter
設定方法3:完全バージョンパス
GPT-Load設定
アップストリームアドレス:
https://openrouter.ai/api/v1
テストパス:
/chat/completions
クライアント設定
Cherry Studio APIアドレス:
http://localhost:3001/proxy/openrouter/
注意:/で終わる必要があり、クライアントの自動v1パス追加を避ける
ベストプラクティス
設定提案
- • 設定方法2を推奨、構造が明確で理解しやすい
- • まず完全なアップストリームAPIアドレスを確定
- • クライアントの特性に応じて適切なパス分割点を選択
- • 設定の一貫性と保守性を維持
デバッグのコツ
- • GPT-Loadリクエストログを確認してアップストリームアドレスを確認
- • テストパスを使用して設定の正確性を検証
- • クライアントのパス連結ルールに注意
- • 異なるシナリオに適応するため柔軟に設定を調整
設定要点まとめ
パス処理ロジックの理解が鍵:GPT-Loadは単純な文字列置換のみを担当し、柔軟な設定方法で様々なクライアントとアップストリームサービスのニーズに対応できます。
コア原則: テストアドレスとクライアントリクエストアドレスがGPT-Loadプロキシを経由した後、最終的なアップストリームアドレスが正確であることを確保。