批处理 - Entity Enricher

批处理

并行丰富多达 100 个实体,支持实时进度跟踪、按提供商限速、自动多模型融合,以及导出为 JSON 或 Excel。批量处理让 Entity Enricher 从单实体工具升级为生产级数据管道。

批处理管道

输入 A

粘贴 JSON 数组

输入 B

从 URL 获取

输入 C

拖放文件

验证并选择

实体列表

选择 entity、对照 schema 校验、行内编辑

并行执行

同时富化所有实体

按 provider 限流、按实体的 SSE 进度、支持取消/重试

自动 FUSION(如果有 2 个及以上模型)

按 entity 合并结果

每个实体完成后会自动运行冲突检测与解决

JSON 导出

结构化结果数组

EXCEL 导出

含冲突的 3 表工作簿

灵活的输入方式

粘贴 JSON

直接将实体对象的 JSON 数组粘贴到编辑器中。系统会自动检测数组结构并提取各个实体。JSON 编辑器提供语法高亮、校验标记和行号。

从 URL 获取

输入 REST API URL 以远程获取实体。支持 bearer 令牌、API 密钥和基本身份验证。系统会自动从嵌套的响应包装器中提取数组(例如 { results: [...] })。

拖放

将 JSON 文件直接拖到页面上。粘贴浮层会检测来自剪贴板或文件拖放的 JSON 内容,并自动加载实体。

实时进度跟踪

每个批处理作业都会通过服务器发送事件(SSE)流式推送进度事件。界面会显示:

每张实体结果卡片均可折叠,展示各模型的选项卡(含原始输出),并在启用融合时提供一个合并结果选项卡。失败的实体可单独重试,无需重新运行整个批次。

按 provider 限流

批处理使用每个提供商的并发信号量以保持在 API 速率限制内。如果您使用 3 个模型丰富 50 个实体,系统不会一次性发起 150 个 API 调用。相反,它会遵守每个提供商配置的速率限制——例如,对 Anthropic 5 个并发调用、对 OpenAI 10 个、对自托管的 Ollama 实例 3 个。

速率限制可在模型管理设置中按提供商配置。系统会在你的限制范围内最大化吞吐量,同时避免 429 错误。

导出格式

JSON 导出

一个结构化 JSON 数组,每个实体对应一个对象。包含完整的富集输出、元数据和融合结果。非常适合程序化使用和下游数据管道。

[
  {
    "entity": { "name": "..." },
    "enriched": { ... },
    "metadata": {
      "models": [...],
      "cost_usd": 0.012
    }
  }
]

Excel 导出

为分析师和利益相关者设计的三工作表工作簿:

  • 结果表: 每个实体一行,将扁平化的增强字段作为列。
  • 汇总表:batch 元数据、model 配置、总成本和处理时间。
  • 冲突表:字段级冲突详情,附带仲裁推理和置信度评分。

取消并重试

运行中的批处理作业可随时取消。取消是平滑的——进行中的 LLM 调用会完成(你仍会得到它们的结果),但不会启动新的调用。已完成的实体会保留其结果。

在启动批次前,系统会根据所选模型、实体数量和模式复杂度提供成本估算。这让您可以在提交运行前验证预期成本。

启动批量充实

上传您的实体列表,选择模型,并行丰富最多 100 个实体。以 JSON 或 Excel 格式导出结果,附带完整的冲突报告。

免费开始使用