批处理 - Entity Enricher

批处理

并行丰富多达 100 个实体，支持实时进度跟踪、按提供商限速、自动多模型融合，以及导出为 JSON 或 Excel。批量处理让 Entity Enricher 从单实体工具升级为生产级数据管道。

批处理管道

输入 A

粘贴 JSON 数组

输入 B

从 URL 获取

输入 C

拖放文件

验证并选择

实体列表

选择 entity、对照 schema 校验、行内编辑

并行执行

同时富化所有实体

按 provider 限流、按实体的 SSE 进度、支持取消/重试

自动 FUSION（如果有 2 个及以上模型）

按 entity 合并结果

每个实体完成后会自动运行冲突检测与解决

JSON 导出

结构化结果数组

EXCEL 导出

含冲突的 3 表工作簿

灵活的输入方式

粘贴 JSON

直接将实体对象的 JSON 数组粘贴到编辑器中。系统会自动检测数组结构并提取各个实体。JSON 编辑器提供语法高亮、校验标记和行号。

从 URL 获取

输入 REST API URL 以远程获取实体。支持 bearer 令牌、API 密钥和基本身份验证。系统会自动从嵌套的响应包装器中提取数组（例如 { results: [...] }）。

拖放

将 JSON 文件直接拖到页面上。粘贴浮层会检测来自剪贴板或文件拖放的 JSON 内容，并自动加载实体。

实时进度跟踪

每个批处理作业都会通过服务器发送事件（SSE）流式推送进度事件。界面会显示：

- 批次总体进度条，含实体完成数
- 每个实体的状态：排队中、运行中、已完成、失败
- 每个实体内各模型的进度（附专业领域标记）
- 使用多个模型时的融合状态
- 整个批次的成本累计

每张实体结果卡片均可折叠，展示各模型的选项卡（含原始输出），并在启用融合时提供一个合并结果选项卡。失败的实体可单独重试，无需重新运行整个批次。

按 provider 限流

批处理使用每个提供商的并发信号量以保持在 API 速率限制内。如果您使用 3 个模型丰富 50 个实体，系统不会一次性发起 150 个 API 调用。相反，它会遵守每个提供商配置的速率限制——例如，对 Anthropic 5 个并发调用、对 OpenAI 10 个、对自托管的 Ollama 实例 3 个。

速率限制可在模型管理设置中按提供商配置。系统会在你的限制范围内最大化吞吐量，同时避免 429 错误。

导出格式

JSON 导出

一个结构化 JSON 数组，每个实体对应一个对象。包含完整的富集输出、元数据和融合结果。非常适合程序化使用和下游数据管道。

[
  {
    "entity": { "name": "..." },
    "enriched": { ... },
    "metadata": {
      "models": [...],
      "cost_usd": 0.012
    }
  }
]

Excel 导出

为分析师和利益相关者设计的三工作表工作簿：

结果表：每个实体一行，将扁平化的增强字段作为列。
汇总表：batch 元数据、model 配置、总成本和处理时间。
冲突表：字段级冲突详情，附带仲裁推理和置信度评分。

取消并重试

运行中的批处理作业可随时取消。取消是平滑的——进行中的 LLM 调用会完成（你仍会得到它们的结果），但不会启动新的调用。已完成的实体会保留其结果。

在启动批次前，系统会根据所选模型、实体数量和模式复杂度提供成本估算。这让您可以在提交运行前验证预期成本。

批量文档|多模型增强|AI 模式生成|所有功能|API 参考

启动批量充实

上传您的实体列表，选择模型，并行丰富最多 100 个实体。以 JSON 或 Excel 格式导出结果，附带完整的冲突报告。

免费开始使用

批处理

批处理管道

灵活的输入方式

粘贴 JSON

从 URL 获取

拖放

实时进度跟踪

按 provider 限流

导出格式

JSON 导出

Excel 导出

取消并重试

相关资源

启动批量充实