智能密钥管理

GPT-Load 采用智能密钥管理机制,通过轮询负载均衡、自动故障检测和恢复机制, 确保服务的高可用性和稳定性。

轮询机制

目标

实现请求在分组内多个密钥间的公平负载均衡。

实现方式

原子计数器

保证高并发下的轮询一致性和公平性

状态过滤

轮询范围仅限于分组内状态为“有效”的密钥

重试与故障处理

触发场景

当请求失败时(HTTP Status ≥ 400 或网络错误)自动触发

处理流程

1
标记失败

为当前失败的密钥失败计数加一

2
获取新密钥

立即通过轮询机制获取分组内下一个可用密钥

3
无感重试

使用新密钥重新发起请求,此过程对客户端无感

4
重试上限

配置的最大重试次数。若所有尝试均失败,则向客户端返回最终错误

密钥拉黑与恢复

拉黑机制

触发条件

当密钥的累计失败计数达到黑名单阈值

执行动作

密钥状态更新为“无效”
从轮询队列中移除,不再接收新请求

恢复机制

触发时机

后台定时任务,按密钥验证间隔周期执行

恢复流程

1

健康检查

使用被拉黑的密钥请求验证接口(如 models 列表)

2

验证成功

• 密钥状态恢复为“有效”

失败计数重置为 0

• 重新加入轮询队列

3

验证失败

保持“无效”状态,等待下一个检查周期

机制优势

负载均衡

原子计数器保证高并发下的公平轮询

自动恢复

定时健康检查,故障密钥自动恢复

故障隔离

快速识别故障密钥,确保服务稳定性