LLM API Gateway：使用Comate Spec Mode创建大模型调用中转服务器

摘要：本文档描述了一个本地大模型API网关(LLMAPIGateway)的开发方案，该网关基于Node.js+Express实现，旨在统一管理多个大模型供应商的API调用。系统包含配置管理、请求转发、响应处理等核心功能，支持OpenAI兼容格式，并提供健康检查、日志记录等辅助功能。文档详细列出了8个开发任务，涵盖从项目初始化到最终测试的全流程，并记录了开发过程中遇到的配置管理、API密钥处理等技术

天马行空skywalk

743人浏览 · 2025-12-09 21:27:15

天马行空skywalk · 2025-12-09 21:27:15 发布

LLM API Gateway 需求文档

需求场景

用户需要建立一个本地大模型API中转服务器，用于统一管理多个大模型供应商的API密钥和调用地址，对外提供统一的访问入口，简化客户端调用流程。

架构技术方案

采用Node.js + Express框架实现轻量级API网关，使用配置文件管理多个后端模型服务，实现请求转发和响应处理。

核心组件

HTTP服务器：基于Express框架，监听本地端口（如1337）
配置管理：JSON配置文件存储多个模型供应商信息
路由转发：将收到的API请求转发到目标模型服务
响应处理：统一处理和返回模型响应
健康检查：监控后端服务可用性

需求处理逻辑

1. 配置管理

支持配置多个模型供应商（OpenAI、Claude、通义千问等）
每个供应商包含：name、apiKey、baseUrl、model映射
支持动态加载和热更新配置

2. 请求转发

接收标准OpenAI格式的API请求
根据请求中的model参数确定目标供应商
自动添加对应的API密钥
转发请求到目标供应商的API端点

3. 响应处理

直接透传供应商响应
统一错误处理和日志记录
支持流式响应和非流式响应

4. 兼容性

兼容OpenAI API格式
支持chat/completions、embeddings等常见端点
保留原始请求的所有参数和头信息

# LLM API Gateway 任务计划

- [ ] 任务1：项目初始化和基础配置

- 1.1: 创建package.json文件，配置项目依赖（express、axios、dotenv等）

- 1.2: 创建基础目录结构（config、utils、routes等）

- 1.3: 创建环境变量配置文件(.env.example和.gitignore)

- 1.4: 创建基础README.md文档

- [ ] 任务2：配置管理系统实现

- 2.1: 创建配置加载工具utils/config.js，实现配置文件读取和验证

- 2.2: 创建模型配置文件config/models.json，定义供应商配置结构

- 2.3: 创建默认配置文件config/default.json，设置服务器默认参数

- 2.4: 实现配置热更新功能，支持运行时重新加载配置

- [ ] 任务3：核心服务器框架搭建

- 3.1: 创建主服务器文件server.js，设置Express应用基础结构

- 3.2: 配置中间件（JSON解析、CORS、日志记录等）

- 3.3: 实现健康检查端点/health，返回服务器和供应商状态

- 3.4: 配置错误处理中间件，统一处理异常响应

- 3.5: 单元测试

- [ ] 任务4：API路由转发核心功能

- 4.1: 创建路由工具utils/router.js，实现请求转发逻辑

- 4.2: 实现POST /v1/chat/completions端点，支持流式和非流式响应

- 4.3: 实现模型参数解析和供应商配置匹配逻辑

- 4.4: 处理API密钥注入和请求头转发

- 4.5: 单元测试

- [ ] 任务5：扩展API端点支持

- 5.1: 实现POST /v1/embeddings端点，支持向量嵌入调用

- 5.2: 实现GET /v1/models端点，返回可用模型列表

- 5.3: 支持其他常见OpenAI兼容端点（如completions、moderations等）

- 5.4: 实现请求参数验证和错误响应

- 5.5: 单元测试

- [ ] 任务6：日志记录和监控系统

- 6.1: 创建日志工具utils/logger.js，实现结构化日志记录

- 6.2: 记录请求转发详情（模型、供应商、响应时间等）

- 6.3: 实现错误日志分级记录和告警机制

- 6.4: 添加请求统计和性能监控功能

- 6.5: 单元测试

- [ ] 任务7：容错和优化机制

- 7.1: 实现供应商API失败重试机制

- 7.2: 添加请求限流和并发控制

- 7.3: 实现供应商健康检查和故障转移

- 7.4: 优化内存使用和请求处理性能

- 7.5: 单元测试

- [ ] 任务8：文档完善和测试验证

- 8.1: 完善README.md，包含安装、配置、使用说明

- 8.2: 创建API使用示例和测试脚本

- 8.3: 验证多个供应商配置和调用功能

- 8.4: 进行集成测试和边界条件验证

LLM API Gateway 任务计划

任务1：项目初始化和基础配置