性能与可靠性
⚡ 为生产而构建:可靠、快速且有恢复力的 MCP 服务器管理,具备智能恢复功能
🔄 高效请求处理
功能描述:直接将请求转发到后端 MCP 服务器,具备适当的错误处理 适用场景:AI 助手和 MCP 服务器之间的可靠通信 优势特点:一致的请求处理、错误恢复、连接管理
⏱️ 设置时间:内置功能 🎯 适用场景:可靠的 MCP 服务器通信、错误处理 ✅ 获得收益:稳定连接、适当的错误处理、请求转发
🔄 自动重试与恢复
功能描述:智能重试逻辑,采用指数退避策略处理连接失败 适用场景:优雅地处理临时服务器故障,无需人工干预 优势特点:自动恢复、熔断器模式、最小服务中断
恢复策略:
连接失败 → 等待 1 秒 → 重试
仍然失败 → 等待 2 秒 → 重试
仍然失败 → 等待 4 秒 → 重试
仍然失败 → 等待 8 秒 → 标记服务器不可用
服务器恢复 → 立即重连
可靠性影响:
- 单个服务器正常运行时间:典型 95%
- 有效系统正常运行时间:采用重试逻辑后 99.9%
- 恢复时间:几秒钟而不是人工干预
⏱️ 设置时间:内置恢复力 🎯 适用场景:生产系统、不可靠网络、关键工作流 ✅ 获得收益:自动恢复、改善正常运行时间、减少维护
⚡️ 请求分页
功能描述:对 list
方法的响应进行分页,高效处理来自多个服务器的大型结果集。 适用场景:防止在聚合来自多个服务器的数千个项目(工具、资源等)时出现内存过载和响应缓慢。 优势特点:不是一次性返回所有结果,而是返回客户端可以浏览的可管理"页面"。
关键详细信息:
- 选择性功能:默认禁用,确保与所有客户端的兼容性。
- 基于游标:使用
nextCursor
令牌获取后续页面。 - 提升可扩展性:对于具有 5 个或更多 MCP 服务器的环境至关重要。
有关如何启用和使用此功能的完整指南,请参见 分页支持指南。
📊 基本监控与日志
功能描述:系统状态的结构化日志和基本监控 适用场景:跟踪系统状态和排除问题 优势特点:基于 Winston 的日志、请求/错误跟踪、连接监控
可用监控:
bash
# 健康端点
GET /health
# OAuth 管理仪表板
GET /oauth
# 用于监控的应用程序日志
# 请求/响应日志
# 带堆栈跟踪的错误跟踪
⏱️ 设置时间:内置日志 🎯 适用场景:基本监控、故障排除、系统状态 ✅ 获得收益:结构化日志、错误跟踪、请求监控
性能优化技巧
连接管理
- 连接池:自动管理 MCP 服务器连接
- Keep-Alive:维持持久连接以提高性能
- 负载均衡:在可用服务器间分发请求
错误处理最佳实践
- 熔断器:防止级联故障
- 优雅降级:服务器不可用时继续运行
- 超时管理:防止挂起请求导致资源耗尽
监控和可观测性
- 日志分析:使用结构化日志获取性能洞察
- 错误跟踪:监控错误率和模式
- 健康检查:定期服务器状态验证
下一步
⚡ 性能提示:这些功能自动工作,确保您的 MCP 服务器保持响应和可用。有关高级监控和可观测性,请参见企业功能。