LlamaExtract(LlamaIndex提供)は、提供したドキュメントからカスタムスキーマに沿って構造化データを抽出し、その基盤には最高クラスのパーサーを備えています。Entity Enricher はその逆で、世界最高峰のLLM(さらにリアルタイムWeb検索とご自身のドキュメント)からエンティティをエンリッチし、すべてのフィールドをモデル間でクロスチェックして矛盾を解決します。両者は「スキーマを入力し、構造化されたJSONを出力する」点で重なりますが、問題の異なる半分を解決しています。
LLM の知識、Web、お客様のドキュメントをソースとして使用し、データに含まれていない情報に回答します。
アップロードした文書にすでに記載されている内容を抽出します。外部の知識やウェブ検索は使用しません。
2つ以上のLLMを並列実行し、フィールドレベルの不一致をアービトレーションして、その推論を記録します。
ドキュメントごとに1回の抽出パス。モデル間の検証や調停はありません。
セマンティックIDは各エンティティに安定した結合キーを付与し、実行、モデル、言語をまたいで重複排除します。
出力は抽出元のドキュメントに限定されます。ドキュメント間の同一性の判断はお客様の責任となります。
Entity Enricher は PDF、Office ファイル、画像をネイティブに取り込むことができ、パーサーの出力を入力として受け取ることもできます。
優れた上流のパーサーです。難しいドキュメントの前処理に使い、その結果を Entity Enricher でエンリッチしましょう。
| 機能 | Entity Enricher | LlamaExtract |
|---|---|---|
| カスタム出力スキーマ | ||
| ドキュメントからの構造化抽出 | ||
| LLM の世界知識から enrichment | ||
| ソースとしてのリアルタイムWeb検索 | ||
| マルチモデルのファンアウト(2 つ以上の LLM を並列実行) | ||
| フィールドレベルのfusionと対立の解決 | ||
| アービトレーション監査証跡 | ||
| セマンティックID(アイデンティティ / 重複排除) | ||
| 事前の entity classification | ||
| 多言語出力(40 言語) | ||
| バッチ処理とストリーミング進捗 | ||
| 独自のキーを使用 / セルフホスト型モデル | 部分的 | |
| REST API + MCP + n8n / Make のインターフェース | API + SDK | |
| 業界最高水準のドキュメント解析 | 組み込み | |
| 料金モデル | トークン従量課金(BYOK) | ページあたり/credit |
トークン従量課金
独自のLLM APIキーを使用し、消費したトークンの料金をプロバイダーに直接お支払いいただけます。ドキュメントの取り込み機能が組み込まれているため、ほとんどのファイルで解析の別途請求が発生しません。
ページあたり/credit
解析・抽出されたページ数に応じて、LlamaCloud のcreditティアで課金されます(開始時に無料ティアあり)。コストはentity数ではなく、ドキュメント量とページ数に応じて増加します。
料金は公開されているティアを反映しており、変更される場合があります。最新のレートは各ベンダーでご確認ください。
ドキュメントを解析し、モデルの知識とWebからエンリッチします。マルチモデルのアービトレーション、監査証跡、セマンティックIDによる同一性判定を、すべて1つのパイプラインで実現します。
無料で始める