Entity Enricher 与 Diffbot——功能对比

Entity Enricher 与 Diffbot 对比

Diffbot 抓取网络并将其构建为一个包含数十亿实体的庞大知识图谱,并提供将网页转化为规范化数据的抽取 API。Entity Enricher 的出发点则不同:它不是查询一个预先构建好的、反映网络现状的图谱,而是根据你的 schema 对你定义的实体进行富集,使用多个 LLM,并结合你的文档和实时网络搜索——内置仲裁与身份识别功能。

主要差异一览

您的 schema 对比他们的图谱

Entity Enricher

你定义输出结构——任意字段、任意嵌套、任意 entity 类型——由 model 来填充。

Diffbot

您查询的是 Diffbot 固定的知识图谱实体类型和字段。数据结构由他们决定。

丰富你的记录 vs 匹配到知识图谱

Entity Enricher

您的输入键会原样保留,并且每个 entity 都会获得一个稳定的、租户范围内的 semantic ID。

Diffbot

实体会匹配到全局知识图谱 ID,而不是围绕您自己的记录建模。

多模型仲裁与单一管道对比

Entity Enricher

两个或更多 LLM 并行作答;冲突会逐字段解决,并存储推理过程。

Diffbot

单一提取/图谱管道。无跨模型验证,也无逐字段审计追踪。

互补优势

Entity Enricher

当实体和模式都属于你自己,且准确性/身份识别比单纯的网络覆盖更重要时最为适用。

Diffbot

当你需要庞大的预建图谱,或需要大规模结构化任意公开网页时最为适用。

功能详细对比

功能Entity EnricherDiffbot
自定义输出 schema(任意字段)固定实体类型
你定义的任意实体类型仅限知识图谱实体类型
可信来源LLM + 你的文档 + 网络网络爬取 + 知识图谱
丰富你自己的记录 / 键匹配到知识图谱实体
多模型交叉验证
字段级仲裁 + 审计记录
语义 ID(你的租户内标识)全局 KG ID
文档摄取(PDF、DOCX、图像)
网页 / HTML 提取通过网络搜索
多语言输出(40 种语言)
自带密钥 / 自托管模型
大规模预构建的实体图谱
REST API + MCP + n8n / Make 界面API
定价模式按 token 计费(BYOK)订阅 / 企业版

何时选择各个平台

在以下情况选择 Entity Enricher:

  • -您需要自定义 schema,而非固定的知识图谱字段
  • -您的 entity 属于特定领域(医药、法律、研究、房地产)
  • -您要对自己的 record 进行 enrichment,并希望保留自己的密钥
  • -准确性需要多模型交叉验证和审计追踪
  • -租户范围内的身份识别和去重比全局图谱更重要
  • -要求数据主权/自托管推理

在以下情况选择 Diffbot:

  • -您需要一个庞大的、预构建的公共网络实体图谱
  • -大规模地结构化任意网页是核心工作
  • -全局知识图谱 ID 契合你的数据模型
  • -您希望在一个产品中同时实现爬取 + 提取 + 图谱
  • -广泛的网络覆盖比自定义 schema 更重要
  • -您要构建的是网络级实体图谱,而非对自己的 record 进行 enrichment

定价对比

Entity Enricher

按 token 计费

自带 LLM API 密钥,直接向您的提供商支付所消耗的 token。无平台订阅费,也没有按次调用的图谱查询费用。

  • - 典型富集:每个实体 $0.001-0.05
  • - 多模型(3 家提供商):每个实体 $0.003-0.15
  • - 提供自托管选项

Diffbot

订阅

按 API 额度/针对知识图谱和提取 API 的查询计量的月度计划,并为大批量抓取和知识图谱访问提供企业级方案。

  • - 基于套餐的 API 调用积分
  • - 面向大批量 / 知识图谱访问的企业版定价
  • - 按查询计费,而非按 token 计费

定价反映公开发布的分级,可能会发生变化——请向各供应商确认当前费率。

丰富你自定义的实体。

摒弃固定的图谱模式。自定义你自己的结构,通过多个模型以及你的文档和网络扩充任何实体,并保留你自己的密钥和身份标识。

免费开始使用