当你在多个 AI 模型上运行同一次富集时,Entity Enricher 可以将结果融合为单一的高置信度输出。融合会检测各模型输出之间的冲突,并使用确定性规则或由 LLM 驱动的仲裁来解决它们。
冲突检测器会比较所有模型输出中的每个字段。所有模型一致的字段将原样通过。模型存在分歧的字段会被标记为需要解决的冲突。
| 类型 | 比较方式 | 一致意味着 |
|---|---|---|
| 标量 | 标准化精确匹配(去除首尾空格、转小写、四舍五入) | 归一化后所有值均相等 |
| 多语言 | 按语言对比 | 各语言键跨模型匹配 |
| 数组 | 集合比较(与顺序无关) | 相同项,与顺序无关 |
| 对象 | 逐属性递归 | 所有嵌套属性均匹配 |
| Null | Null 等同于缺失 | 视为等同 |
冲突将使用两种方法之一解决,具体取决于你是否在侧边栏中选择了仲裁模型。
根据每个字段的数据类型应用确定性规则。无需额外的 LLM 调用——解决过程即时且免费。
| 字段类型 | 规则 | 理由 |
|---|---|---|
| 字符串 | 多数投票;平局时取最长值 | 通常细节越多越好 |
| 数字 | 中位数值 | 对异常值稳健 |
| 布尔值 | 多数;平局时取 true | 保守默认值 |
| 多语言 | 按语言多数投票 | 各语言独立解析 |
| 数组 | 所有项的并集 | 保留所有信息 |
| 对象 | 逐字段递归 | 将规则应用于嵌套字段 |
| Null 与值 | 优先非空值 | 数据缺失比任何值都更糟 |
决胜规则:票数相同时,价格更高的 model 所提供的值胜出(作为能力的代理指标),其次按 model 名称的字母顺序排序。
当你在侧边栏选择仲裁模型时,冲突会被发送给 LLM 进行智能解决。仲裁器会接收实体上下文、架构字段描述以及所有冲突值,然后做出有依据的决策。
回退:如果仲裁模型失败(超时、错误),系统会自动回退到基于规则的合并,从而确保你始终能得到结果。
冲突解决后,系统会构建单个合并结果,并将其作为“仲裁”记录存储在数据库中。每个合并结果都包含审计追踪,以便你追溯每个冲突的解决方式。
每条合并结果都包含记录融合过程的元数据:
融合完成后,结果面板中的“合并”选项卡会显示:
在批量增强中,当您选择两个或更多模型时,融合会自动进行。您无需手动点击“合并结果”——一旦某个实体的所有模型都完成,融合就会运行,合并后的结果会与各个模型的输出一起显示。
fusion_started、conflicts_detected 和 fusion_completed 事件。