智能密钥管理

GPT-Load 采用智能密钥管理机制，通过轮询负载均衡、自动故障检测和恢复机制，确保服务的高可用性和稳定性。

轮询机制

目标

实现请求在分组内多个密钥间的公平负载均衡。

实现方式

原子计数器

保证高并发下的轮询一致性和公平性

状态过滤

轮询范围仅限于分组内状态为"有效"的密钥

重试与故障处理

触发场景

当请求失败时（HTTP Status ≥ 400 或网络错误）自动触发

处理流程

1

标记失败

为当前失败的密钥失败计数加一

2

获取新密钥

立即通过轮询机制获取分组内下一个可用密钥

3

无感重试

使用新密钥重新发起请求，此过程对客户端无感

4

重试上限

配置的最大重试次数。若所有尝试均失败，则向客户端返回最终错误

密钥拉黑与恢复

拉黑机制

触发条件

当密钥的累计失败计数达到黑名单阈值

执行动作

密钥状态更新为"无效"

从轮询队列中移除，不再接收新请求

恢复机制

触发时机

后台定时任务，按密钥验证间隔周期执行

恢复流程

1

健康检查

使用被拉黑的密钥请求验证接口（如 models 列表）

2

验证成功

• 密钥状态恢复为"有效"

• 失败计数重置为 0

• 重新加入轮询队列

3

验证失败

保持"无效"状态，等待下一个检查周期

机制优势

负载均衡

原子计数器保证高并发下的公平轮询

自动恢复

定时健康检查，故障密钥自动恢复

故障隔离

快速识别故障密钥，确保服务稳定性