Diffbot 抓取网络并将其构建为一个包含数十亿实体的庞大知识图谱,并提供将网页转化为规范化数据的抽取 API。Entity Enricher 的出发点则不同:它不是查询一个预先构建好的、反映网络现状的图谱,而是根据你的 schema 对你定义的实体进行富集,使用多个 LLM,并结合你的文档和实时网络搜索——内置仲裁与身份识别功能。
你定义输出结构——任意字段、任意嵌套、任意 entity 类型——由 model 来填充。
您查询的是 Diffbot 固定的知识图谱实体类型和字段。数据结构由他们决定。
您的输入键会原样保留,并且每个 entity 都会获得一个稳定的、租户范围内的 semantic ID。
实体会匹配到全局知识图谱 ID,而不是围绕您自己的记录建模。
两个或更多 LLM 并行作答;冲突会逐字段解决,并存储推理过程。
单一提取/图谱管道。无跨模型验证,也无逐字段审计追踪。
当实体和模式都属于你自己,且准确性/身份识别比单纯的网络覆盖更重要时最为适用。
当你需要庞大的预建图谱,或需要大规模结构化任意公开网页时最为适用。
| 功能 | Entity Enricher | Diffbot |
|---|---|---|
| 自定义输出 schema(任意字段) | 固定实体类型 | |
| 你定义的任意实体类型 | 仅限知识图谱实体类型 | |
| 可信来源 | LLM + 你的文档 + 网络 | 网络爬取 + 知识图谱 |
| 丰富你自己的记录 / 键 | 匹配到知识图谱实体 | |
| 多模型交叉验证 | ||
| 字段级仲裁 + 审计记录 | ||
| 语义 ID(你的租户内标识) | 全局 KG ID | |
| 文档摄取(PDF、DOCX、图像) | ||
| 网页 / HTML 提取 | 通过网络搜索 | |
| 多语言输出(40 种语言) | ||
| 自带密钥 / 自托管模型 | ||
| 大规模预构建的实体图谱 | ||
| REST API + MCP + n8n / Make 界面 | API | |
| 定价模式 | 按 token 计费(BYOK) | 订阅 / 企业版 |
按 token 计费
自带 LLM API 密钥,直接向您的提供商支付所消耗的 token。无平台订阅费,也没有按次调用的图谱查询费用。
订阅
按 API 额度/针对知识图谱和提取 API 的查询计量的月度计划,并为大批量抓取和知识图谱访问提供企业级方案。
定价反映公开发布的分级,可能会发生变化——请向各供应商确认当前费率。
摒弃固定的图谱模式。自定义你自己的结构,通过多个模型以及你的文档和网络扩充任何实体,并保留你自己的密钥和身份标识。
免费开始使用