GPT-Load プロジェクト紹介

複数の AI サービスを統合する必要がある企業や開発者向けに特別に設計された、高性能でエンタープライズグレードの AI インターフェース透明プロキシサービスです。Go 言語で開発され、インテリジェントなキー管理、ロードバランシング、包括的な監視機能を備え、高い並行性を持つ本番環境向けに設計されています。

コアコンセプト

透明プロキシ

GPT-Load は透明プロキシサービスとして機能し、各 AI サービスプロバイダーのネイティブ API フォーマットを完全に保持し、フォーマット変換や統一は行いません。ユーザーが GPT-Load にリクエストする方法は、GPT-Load が上流サービスにリクエストする方法と全く同じで、完全に透明なプロキシ機能を実現します。

サポートされている AI サービス

OpenAI

  • • 公式 OpenAI API
  • • Azure OpenAI
  • • OpenAI フォーマット互換のすべてのサードパーティサービス

Google Gemini

  • • Gemini Pro
  • • Gemini Pro Vision
  • • マルチモーダル機能のサポート

Anthropic Claude

  • • Claude シリーズモデル
  • • 高品質な会話生成
  • • ネイティブ API フォーマットサポート

コア機能

高性能アーキテクチャ

ゼロコピーストリーミング転送、Go ゴルーチンベースの並行モデル、高並行接続をサポート

インテリジェントキー管理

グループ管理、動的ローテーション、自動リトライ、高いサービス可用性を保証

ロードバランシング

マルチアップストリームサポート、重み設定、ヘルスチェック、利用可能なノードへのインテリジェントルーティング

クラスターサポート

マスター/スレーブアーキテクチャ、ステートレス設計、水平スケーリングをサポート

ホットリロード設定

3層設定システム:環境変数、システム設定、グループ設定、ホットアップデートをサポート

管理パネル

Vue 3 モダンインターフェース、リアルタイム監視、ログ表示、設定管理

技術スタック

バックエンド技術

  • Go 1.23+ - 主要プログラミング言語
  • Gin - HTTP Web フレームワーク
  • GORM - ORM データベース操作フレームワーク
  • MySQL 8.2+ - 主要データベースストレージ
  • Redis - 分散キャッシュと状態管理
  • Uber Dig - 依存性注入コンテナ

フロントエンド & DevOps

  • Vue 3 - フロントエンドフレームワーク
  • TypeScript - 型安全性
  • Naive UI - UI コンポーネントライブラリ
  • Docker - コンテナ化デプロイメント
  • Docker Compose - コンテナオーケストレーション
  • GitHub Actions - CI/CD パイプライン

アーキテクチャの利点

マイクロサービスアーキテクチャ

  • • モジュラー設計
  • • 依存性注入
  • • インターフェース駆動

分散設計

  • • マスター/スレーブモード
  • • 分散ロック
  • • キャッシュ同期

高可用性

  • • グレースフル降格
  • • 障害回復
  • • リソース保護

ユースケース

エンタープライズ AI サービス

  • • 大規模 API 呼び出し
  • • コスト制御最適化
  • • サービス安定性保証

開発者ツール

  • • 統一 API アクセス
  • • デバッグと監視
  • • 迅速なデプロイメント

マルチテナントサービス

  • • テナント分離
  • • 設定カスタマイズ
  • • 使用統計

GPT-Load を始める

Docker Compose で迅速にデプロイし、数分で完全な AI インターフェースプロキシサービスを開始

デプロイメントガイドを見る