LLMデータ抽出とAIデータエンリッチメントの機能 | Entity Enricher

機能

AIによるエンティティエンリッチメントに必要なすべて — スキーマ生成からバッチエクスポートまで。

スキーマインテリジェンス

AIによるスキーマ生成

任意のJSONを貼り付けてください。AIがエキスパティーズドメイン、検索キー、多言語フィールドを備えた型付きスキーマを生成します。最大6回の自己修正付きです。

自然言語での編集

「parent_company の参照を追加」と入力してスキーマを変更しましょう。AI が変更を適用し、5つの改善案を提案します。

ビジュアルschemaエディター

専門領域によるグループ化、インライン編集、キーボードナビゲーション、元に戻す/やり直し、自動保存を備えたドラッグ&ドロップのプロパティツリー。

8ルール検証

型の正しさ、$refの整合性、expertise domainの割り当て — すべて自動的に強制されるため、結果を確認する前にLLMが自己修正します。

エンリッチメントエンジン

マルチ専門領域戦略

スキーマはドメイン(財務、規制、一般)ごとに分割されます。各専門領域は並列 LLM 呼び出しとして実行され、より深く専門的な結果を得られます。

事前 classification

安価なLLMがエンリッチメント前にエンティティタイプを分類し、エンティティがスキーマに一致しない場合のハルシネーションを防ぎます。

自己修正する出力

モデルの検証は、実行時に LLM の癖を検出します。インデックス付き辞書は配列に、文字列の null は本物の null に変換され、必須フィールドは再試行をトリガーします。

多言語エンリッチメント

40 言語で同時に enrichment します。多言語フィールドは言語ごとの値を持つ言語辞書としてラップされます。

詳細はこちら →

セマンティックID

オブジェクトのキー項目から割り当てられる、組織スコープの安定したIDです。同じエンティティがエンリッチメント、言語、時間をまたいで重複排除され、エンティティ解決が組み込まれています。

詳細はこちら →
マルチモデルフュージョン

並列比較

2つ以上のLLMモデルを並列に実行します。マージする前にフィールドごとに結果を比較します。

コンフリクト検出

型を考慮した比較: スカラーは完全一致、多言語は言語ごと、配列は集合比較、オブジェクトは再帰的に比較します。

スマート解決

ルールベースのマージ(多数決・中央値・和集合)、または推論・信頼度レベル・完全な監査証跡を伴うLLMアービトレーション。

バッチとスケール

並列バッチ処理

最大100件のエンティティを、プロバイダーごとのレート制限とリアルタイムのSSE進捗とともに同時にエンリッチします。

認証付きURLフェッチ

bearer、API キー、または basic 認証を使って、任意の REST API からエンティティをプルします。レスポンスラッパーから配列を自動抽出します。

Excel エクスポート

3シート構成のワークブック:Results(エンティティごとに1行)、Summary(メタデータとコスト)、Conflicts(解決の詳細)。

リトライとキャンセル

実行中の処理を安全に完了させてキャンセルします。失敗したentityのみを再試行します。開始前にコストを見積もります。

開発者 & 運用

REST API

OpenAPIドキュメント付きのプログラムアクセス。サービス間連携向けにロールベースの権限を備えたorganizationキーを提供します。

コスト分析

時系列チャート、プロバイダー別の内訳、モデルごとのパフォーマンス統計。すべての操作にわたる支出を追跡します。

マルチテナンシー

四つの役割(admin、owner、editor、operator)による組織分離。使用状況の追跡を備えた組織ごとのLLMプロバイダーキー。