管理 LLM 提供商和模型,从外部注册表同步模型,运行健康检查,并为各组织配置独立计费的 API 密钥。
Entity Enricher 支持广泛的 LLM 提供商。每个提供商可拥有多个模型,各自具有独立的定价、功能和配置。
许多团队会将 LLM 流量路由经过企业 AI 网关、区域端点或某个未内置的提供商 —— 例如企业级 LiteLLM 代理、Cloudflare AI Gateway 或 Alibaba DashScope(用于 Qwen 模型)。您可以将它们作为各自独立的标准(OpenAI 兼容)提供商添加,并使用自定义基础 URL。
acme-openai-gw)。openai 或 anthropic 等内置名称为保留名称。 https://gateway.example.com/v1。对于 Entity Enricher 没有内置客户端的任何提供商,此字段为必填。 https:// URL。环回地址和私有网段(localhost、 10.x、 192.168.x)会被拒绝,以防止 SSRF — 自托管服务器必须能通过互联网访问。对于本地 Ollama,请改用专用的 Ollama 隧道。/v1 协议(chat completions、/models)。{endpoint}/models 以在您运行 enrichment 前验证密钥和基础 URL。每个提供商都有一项每密钥最大并发调用数设置(即其限流覆盖值)。它限制单个 API 密钥并行运行的 LLM 调用数量——涵盖使用该密钥的所有流程:多专业领域增益的扇出、分类、仲裁以及 schema/样本生成。
这与你套餐的最大并发作业数限制不同,后者限制的是整个 organization 在所有 provider 上同时运行的 enrichment 作业数量。
每个模型都会追踪其能力,并在模型选择器中以图标形式显示:
| 能力 | 描述 |
|---|---|
| 视觉 | 可处理图像和视觉输入 |
| 工具调用 | 支持函数调用 / 工具使用 |
| 音频输入 | 可处理音频输入 |
| PDF 输入 | 可处理 PDF 文档 |
| 提示词缓存 | 支持 prompt 缓存以降低成本 |
| 推理 | 扩展思考/思维链能力 |
通过从外部注册表同步来保持模型定价最新。同步过程会自动检测新模型、价格变化以及已移除的模型。
默认定价来源。从 GitHub 上由 LiteLLM 社区维护的注册表获取真实的 API 模型名称、定价、上下文长度和功能。
覆盖约 30 个提供商。不包含显示名称、基准测试或生成速度。
来自 pricepertoken.com 的替代数据源。包含显示名称、基准测试(编程和数学得分)以及生成速度(每秒 token 数)。
覆盖约 20 个提供商。提供比 LiteLLM 更丰富的元数据。
通过运行最小化的健康检查提示词,主动验证模型是否可访问。这能在用户于富集过程中遇到错误之前捕获失效的模型。
健康检查可针对所有模型、某个特定 provider 的模型或单个模型运行。结果通过 SSE 实时传输,并以进度条显示通过/失败数量。
当扩充调用因“未找到模型”错误而失败时,该模型会被自动停用,以防止重复失败。这会在正常扩充操作期间实时发生。
| 停用原因 | 设置者 | 已自动重新激活? |
|---|---|---|
| 未找到模型 | 丰富化错误或健康检查 | 是(通过定价同步或校验) |
| 同步已移除 | 定价同步(模型已消失) | 是(如果 model 重新出现在注册表中) |
| 手动 | 界面中的管理员开关 | 否(仅手动重新激活) |
组织可以配置自己的 LLM 提供商 API 密钥,以实现独立计费和使用情况跟踪。系统采用两级密钥解析并结合 LRU 选择:
在“API 密钥”页面为各组织配置密钥。支持每个 provider 配置多个密钥并进行 LRU 轮换。使用 Fernet 加密。
由管理员管理的全系统范围密钥。在所有 organization 之间共享。同时支持每个 provider 配置多个密钥并采用 LRU 轮换。
每次增益都会记录所使用的密钥,因此你可以按密钥追踪成本。密钥支持健康检查、使用计数,并会在永久性故障(密钥无效、需要付费)时自动禁用。被限流的密钥会被临时退避,同时使用密钥池中的其他密钥。请在 API Keys 指南中了解如何管理密钥。
将您的全部提供商和模型配置导出为 JSON,以便备份或转移到其他实例。导入始终为 upsert 操作:现有的提供商和模型按名称匹配并就地更新,新增的则会被添加——不会删除任何内容。
导出内容包括提供商设置、模型配置、定价、功能以及规范的模型规格——但绝不包含 API 密钥,密钥单独存储。导入后需另行配置 API 密钥。系统管理员可备份完整的全局目录;组织所有者只能导出和导入自己组织的提供商和模型——共享的全局目录无法通过导入创建或编辑。