Diffbotはウェブをクロールし、数十億のエンティティからなる巨大なナレッジグラフへと構造化します。ページを正規化されたデータへ変換する抽出APIも備えています。Entity Enricherは異なる出発点を取ります。現存するウェブのあらかじめ構築されたグラフに問い合わせるのではなく、複数のLLMに加えてあなたのドキュメントとライブなウェブ検索を用いて、あなたのスキーマに対してあなたが定義するエンティティをエンリッチします — アービトレーションとアイデンティティを組み込んだ形で。
出力構造は — 任意のフィールド、任意のネスト、任意のエンティティタイプ — お客様が定義し、モデルがそれを埋めます。
Diffbotの固定されたナレッジグラフのentityタイプとフィールドを照会します。その形式は彼らのものです。
入力キーはそのまま保持され、各 entity には安定したテナント単位の semantic ID が付与されます。
エンティティは、お客様独自のレコードを軸にモデル化されるのではなく、グローバルなナレッジグラフのIDにマッチングされます。
2つ以上のLLMが並行して回答し、競合はフィールドごとに解決され、その推論が保存されます。
単一の抽出/グラフパイプライン。モデル間の検証やフィールドごとの監査証跡はありません。
エンティティとスキーマが自社のもので、Webの網羅性よりも精度や同一性が重要な場合に最適です。
巨大な構築済みグラフが必要な場合や、任意の公開Webページを大規模に構造化する必要がある場合に最適です。
| 機能 | Entity Enricher | Diffbot |
|---|---|---|
| カスタム出力スキーマ(任意のフィールド) | 固定のエンティティタイプ | |
| 定義した任意のエンティティタイプ | KG エンティティタイプのみ | |
| 信頼できる情報源 | LLM + ご自身のドキュメント + Web | Web クロール + ナレッジグラフ |
| 自分のレコード / キーをエンリッチ | KGエンティティに一致させる | |
| マルチモデルによるクロスバリデーション | ||
| フィールドレベルのarbitration + 監査証跡 | ||
| セマンティックID(テナント固有のアイデンティティ) | グローバル KG ID | |
| ドキュメントの取り込み (PDF、DOCX、画像) | ||
| Web ページ / HTML 抽出 | ウェブ検索経由 | |
| 多言語出力(40 言語) | ||
| 独自のキーを使用 / セルフホスト型モデル | ||
| 大規模な構築済みエンティティグラフ | ||
| REST API + MCP + n8n / Make のインターフェース | API | |
| 料金モデル | トークン従量課金(BYOK) | サブスクリプション / エンタープライズ |
トークン従量課金
独自のLLM APIキーを使用し、消費したトークンの料金をプロバイダーに直接お支払いいただけます。プラットフォームのサブスクリプションも、コールごとのグラフクエリ料金もありません。
サブスクリプション
ナレッジグラフおよび抽出 API に対する API クレジット/クエリで従量課金される月額プラン。大量のクロールと KG アクセス向けのエンタープライズ層もあります。
料金は公開されているティアを反映しており、変更される場合があります。最新のレートは各ベンダーでご確認ください。
固定的なグラフschemaは不要です。独自の構造を定義し、複数のmodelに加えてドキュメントやWebから任意のentityをenrichmentし、独自のキーとアイデンティティを維持できます。
無料で始める