同じエンティティに対して複数のAIモデルを並列実行し、それぞれの出力間のフィールドレベルの競合を検出して、結果を単一の高信頼度レコードにフュージョンします。これがEntity Enricherの核となる差別化ポイントです。単一のLLMを信頼するのではなく、複数のプロバイダー間でクロス検証することで、最大限のデータ精度を実現します。
エンティティデータ + スキーマ
独立してエンリッチします
独立してエンリッチします
独立してエンリッチします
すべてのmodel出力にわたるフィールドごとの比較
ルールベースのマージ
多数決、中央値、和集合
LLM調停
AIが推論によって解決します
監査証跡付きの単一の高信頼度レコード
enrichment ジョブに複数の model を選択すると、Entity Enricher は同じ entity データと schema を各 model へ同時に送信します。各 model は他の model の出力を知らずに独立して実行され、真に独立したデータポイントを保証します。
本システムは、プロバイダーの任意の組み合わせをサポートしています。Anthropic Claude、OpenAI GPT-4、Google Gemini、Mistral、または Ollama 経由のセルフホストモデルなどです。プロバイダーごとのレート制限により、各プロバイダーの API 制限内に収まりつつ、スループットを最大化できます。
リアルタイムのSSEストリーミングにより、各モデルの完了に合わせて進捗が表示されます。マルチ専門領域戦略を使用する場合は専門領域ごとの進捗も含まれます。すべてのモデルが完了する前に部分的な結果を確認できます。
すべてのモデルが完了すると、競合検出エンジンがそれらの出力をフィールドごとに比較します。この比較は型を認識し、フィールドの型ごとに異なる比較ルールが使用されます:
| フィールドタイプ | 比較方法 | 一致ルール |
|---|---|---|
| 文字列 / スカラー | 完全一致(正規化済み) | 大文字小文字/空白の正規化後、すべての値が等しい必要があります |
| 数値 | 数値の完全一致 | すべての値が同一の数値である必要があります |
| ブール値 | 完全一致 | すべてのモデルがtrue/falseで一致する必要があります |
| 多言語対応 | 言語ごとの比較 | 各言語キーを個別に比較 |
| 配列 | 集合比較(順序は無視) | 順序に関係なく同じ項目 |
| オブジェクト | プロパティ単位の再帰処理 | すべてのネストされたフィールドが一致する必要があります |
| Null値 | null == 欠損 | Nullと欠損は同等として扱われます |
投票ルールによる確定的な解決です。高速で予測可能、追加の LLM 呼び出しは不要です。
調停モデルが、エンティティのコンテキストとフィールドの説明を用いて各競合をレビューし、構造化された判断を行います。
フュージョンされたすべてのレコードには、完全な来歴を持つアービトレーションメタデータが含まれます:
このメタデータはフュージョンされたレコードとともに保存され、Excelの競合シートにエクスポートされます。これにより、意思決定の来歴が重要となるコンプライアンスワークフローに適しています。
財務デューデリジェンス、医薬品の安全性プロファイル、そして誤りが重大な結果をもたらすコンプライアンススクリーニング。
複数のソース間で情報が矛盾するエンティティ(ソースによって報告が異なる資金調達額、設立日、規制ステータスなど)。
単一の model が完全な知識を持たない場合。LLM ごとに学習データが異なるため、複数の model を実行することでギャップを埋められます。
下流の利用側が最終的な値だけでなく、各データポイントの信頼度スコアと出所情報を必要とする場合に適しています。
2つ以上のモデルを選択して並列実行し、フュージョンがどのように競合を解決するかをご覧ください。月額契約は不要です。ご自身のAPIキーを使用し、トークンごとにお支払いいただけます。
無料で始める