逐步演示 Entity Enricher 如何处理单个实体——从输入,经过分类、并行模型执行,到结构化输出。
打开模式编辑器页面并设置您的扩充。工作流步骤引导您完成流水线各阶段:示例数据、模式、扩充和结果。
粘贴 JSON 样本以自动生成 schema,然后浏览交互式属性树。编辑属性、添加专长领域,并将字段标记为搜索键或保留字段。
配置扩充选项(策略、模型、语言、分类,以及响应 schema 和严格结构化输出开关),并填写实体搜索键(名称、网站、国家/地区等)以识别该实体。
实时显示每个模型的进度和结果。使用多个模型时,会出现用于融合的“合并结果”按钮。
如果您选择了分类模型,系统会先执行一次快速、低成本的 LLM 调用,以验证实体是否与 schema 类型匹配。这可以避免在实体不匹配时将 token 浪费在增强上。详见分类文档。
每个选定的 model 都会使用你选择的策略处理 entity。当选择了多个 model 时,它们会跨 provider 并行运行(Claude 和 GPT-4 同时运行),而同一 provider 的 model 则依次运行以遵守速率限制。
每个 LLM 响应都会实时根据你的 schema 进行校验。当输出与预期类型或约束不符时,系统会自动将错误发回给 LLM 进行修正。
每次 LLM 调用最多可自动重试 5 次。每次重试都会包含具体的验证错误,以便 LLM 明确知道需要修正的内容。
两个可选开关会要求提供商在输出返回之前就对其加以约束,从而从一开始就减少需要纠正的响应。二者仅适用于支持它们的模型;其余一切仍会回退到上面的验证并重试流程。
Entity Enricher 使用服务器发送事件(SSE)实时流式传输进度。您无需等待所有模型完成——结果会随着每个专业领域或模型的完成而逐步显示。
每个模型都有其专属结果面板,展示结构化 JSON 输出、各专业领域的进度标记、token 用量、成本和处理时间。使用多专业领域策略时,专业领域标记会在各领域完成时实时更新。
使用多专业领域策略时,部分专业领域可能失败,而其他专业领域成功。Entity Enricher 不会丢弃全部结果,而是返回成功专业领域合并后的输出,并标记为“部分完成”状态。随后你只需重试失败的专业领域,而无需重新运行整个富集。
增强完成后,你的结果会保存到“记录”页面以供日后查阅。如果你使用了多个模型,可以使用多模型融合合并结果。