LlamaExtract(来自 LlamaIndex)借助一流的解析器,依据自定义 schema 从你提供的文档中提取结构化数据。Entity Enricher 的做法正相反:它借助全球最优秀的 LLM——以及实时网络搜索和你的文档——来富集实体,然后在多个模型间交叉核对每个字段并解决冲突。二者都做到了“输入 schema、输出结构化 JSON”,但解决的是问题中的不同部分。
利用 LLM 知识、网络以及你的文档作为来源,回答你的数据中不包含的内容。
提取您上传的文档中已写明的内容。不使用外部知识或网络查询。
并行运行 2 个以上 LLM,并对字段级分歧进行仲裁,同时记录推理过程。
每个文档单次提取过程。无跨模型验证或仲裁。
语义 ID 为每个实体提供稳定的关联键,可跨运行、跨模型、跨语言去重。
输出的范围限定于您从中提取的文档;跨文档的身份识别需由您自行处理。
Entity Enricher 已原生支持摄取 PDF、Office 文件和图像,并可将解析器的输出作为输入。
一个出色的上游解析器。用它来预处理困难的文档,然后在 Entity Enricher 中扩充结果。
| 功能 | Entity Enricher | LlamaExtract |
|---|---|---|
| 自定义输出 schema | ||
| 从文档中进行结构化提取 | ||
| 从 LLM 的世界知识中富化 | ||
| 将实时网络搜索作为数据源 | ||
| 多模型扇出(2 个以上 LLM 并行) | ||
| 字段级融合与冲突解决 | ||
| 仲裁审计追踪 | ||
| 语义 ID(标识 / 去重) | ||
| 预检 entity classification | ||
| 多语言输出(40 种语言) | ||
| 批处理与流式进度 | ||
| 自带密钥 / 自托管模型 | 部分 | |
| REST API + MCP + n8n / Make 界面 | API + SDK | |
| 一流的文档解析 | 内置 | |
| 定价模式 | 按 token 计费(BYOK) | 每页 / credit |
按 token 计费
自带 LLM API 密钥,直接向您的提供商支付所消耗的 token。文档摄取功能已内置,因此大多数文件无需单独的解析费用。
每页 / credit
按解析和提取的页数计费,采用 LlamaCloud credit 分级(提供免费额度供起步)。成本随文档量和页数而非 entity 数量增长。
定价反映公开发布的分级,可能会发生变化——请向各供应商确认当前费率。
解析文档并基于模型知识和网络进行 enrichment——多模型 arbitration、审计追踪和 semantic ID 身份识别,全部集成于一条流水线。
免费开始使用