LLMデータ抽出とAIデータエンリッチメントの機能 | Entity Enricher

機能

AIによるエンティティエンリッチメントに必要なすべて — スキーマ生成からバッチエクスポートまで。

スキーマインテリジェンス

任意のJSONを貼り付けてください。AIがエキスパティーズドメイン、検索キー、多言語フィールドを備えた型付きスキーマを生成します。最大6回の自己修正付きです。

「parent_company の参照を追加」と入力してスキーマを変更しましょう。AI が変更を適用し、5つの改善案を提案します。

専門領域によるグループ化、インライン編集、キーボードナビゲーション、元に戻す／やり直し、自動保存を備えたドラッグ＆ドロップのプロパティツリー。

型の正しさ、$refの整合性、expertise domainの割り当て — すべて自動的に強制されるため、結果を確認する前にLLMが自己修正します。

エンリッチメントエンジン

スキーマはドメイン（財務、規制、一般）ごとに分割されます。各専門領域は並列 LLM 呼び出しとして実行され、より深く専門的な結果を得られます。

安価なLLMがエンリッチメント前にエンティティタイプを分類し、エンティティがスキーマに一致しない場合のハルシネーションを防ぎます。

モデルの検証は、実行時に LLM の癖を検出します。インデックス付き辞書は配列に、文字列の null は本物の null に変換され、必須フィールドは再試行をトリガーします。

40 言語で同時に enrichment します。多言語フィールドは言語ごとの値を持つ言語辞書としてラップされます。

オブジェクトのキー項目から割り当てられる、組織スコープの安定したIDです。同じエンティティがエンリッチメント、言語、時間をまたいで重複排除され、エンティティ解決が組み込まれています。

マルチモデルフュージョン

2つ以上のLLMモデルを並列に実行します。マージする前にフィールドごとに結果を比較します。

型を考慮した比較: スカラーは完全一致、多言語は言語ごと、配列は集合比較、オブジェクトは再帰的に比較します。

ルールベースのマージ（多数決・中央値・和集合）、または推論・信頼度レベル・完全な監査証跡を伴うLLMアービトレーション。

バッチとスケール

最大100件のエンティティを、プロバイダーごとのレート制限とリアルタイムのSSE進捗とともに同時にエンリッチします。

bearer、API キー、または basic 認証を使って、任意の REST API からエンティティをプルします。レスポンスラッパーから配列を自動抽出します。

3シート構成のワークブック：Results（エンティティごとに1行）、Summary（メタデータとコスト）、Conflicts（解決の詳細）。

実行中の処理を安全に完了させてキャンセルします。失敗したentityのみを再試行します。開始前にコストを見積もります。

開発者 & 運用

OpenAPIドキュメント付きのプログラムアクセス。サービス間連携向けにロールベースの権限を備えたorganizationキーを提供します。

時系列チャート、プロバイダー別の内訳、モデルごとのパフォーマンス統計。すべての操作にわたる支出を追跡します。

四つの役割（admin、owner、editor、operator）による組織分離。使用状況の追跡を備えた組織ごとのLLMプロバイダーキー。