Entity Enricher が単一のエンティティを処理する流れを、入力から分類、並列モデル実行、構造化出力までステップごとに解説します。
スキーマエディターのページを開き、エンリッチメントを設定します。ワークフローのステッパーが、サンプルデータ、スキーマ、エンリッチメント、結果の各パイプライン段階をガイドします。
サンプルJSONを貼り付けてスキーマを自動生成し、インタラクティブなプロパティツリーを探索しましょう。プロパティを編集し、エキスパティーズドメインを追加し、フィールドを検索キーまたは保持対象としてマークできます。
エンリッチメントのオプション(戦略、モデル、言語、分類、加えてレスポンススキーマと厳格な構造化出力の切り替え)を設定し、エンティティ検索キー(名称、ウェブサイト、国など)を入力してエンティティを特定します。
各モデルのリアルタイムの進捗と結果を表示します。複数のモデルを使用する場合、フュージョン用に「結果をマージ」ボタンが表示されます。
分類モデルを選択した場合、まず高速で低コストなLLM呼び出しが実行され、エンティティがスキーマのタイプに一致するかを検証します。これにより、エンティティが一致しない場合にエンリッチメントでトークンを無駄にすることを防ぎます。詳しくは分類のドキュメントをご覧ください。
選択された各 model は、選んだストラテジーを使用して entity を処理します。複数の model を選択した場合、それらはprovider をまたいで並列に実行され(Claude と GPT-4 は同時に実行)、同じ provider の model はレート制限を尊重するため順次実行されます。
各 LLM の応答は、リアルタイムで schema に対して検証されます。出力が期待される型や制約に一致しない場合、システムは自動的にエラーを LLM に返して修正させます。
LLM 呼び出しごとに最大 5 回の自動リトライを行います。各リトライには具体的な検証エラーが含まれるため、LLM は修正すべき箇所を正確に把握できます。
2つのオプションのトグルは、レスポンスが返ってくる前に出力を制約するようプロバイダーに要求するため、そもそも修正が必要なレスポンスが減ります。どちらもそれをサポートするモデルにのみ適用され、すべては上記の検証・リトライループにフォールバックします。
Entity Enricher は Server-Sent Events(SSE)を使用して進捗をリアルタイムでストリーミングします。すべてのモデルの完了を待つ必要はなく、各専門領域やモデルが完了するにつれて結果が段階的に表示されます。
各モデルには、構造化された JSON 出力、expertise ごとの進捗バッジ、トークン使用量、コスト、処理時間を表示する専用の結果パネルがあります。マルチ expertise 戦略を使用する場合、各ドメインが完了するにつれて expertise バッジがリアルタイムで更新されます。
マルチ expertise domain 戦略を使用する場合、一部の expertise domain が失敗し、他が成功することがあります。Entity Enricher はすべてを破棄するのではなく、成功した expertise domain のマージ済み出力を「Partial」ステータスで返します。その後、enrichment 全体を再実行せずに、失敗した expertise domain のみを再試行できます。
エンリッチメントが完了すると、結果は今後の参照用にRecordsページに保存されます。複数のモデルを使用した場合は、マルチモデルフュージョンを使用して結果を統合できます。