AIによるスキーマ生成 - Entity Enricher

AIによるスキーマ生成

任意のJSONデータサンプルを貼り付けるだけで、AIがエキスパティーズドメイン、検索キー、多言語フィールド検出、検証ルールを完備した、完全に型付けされたエンリッチメントスキーマを生成します。生成プロセスには最大6回の自己修正が含まれており、あなたが目にする前にスキーマが有効であることを保証します。

スキーマ生成パイプライン

ステップ1

サンプルJSONを貼り付け

エンティティデータを表す任意のJSONオブジェクトまたは配列

ステップ2

AIがスキーマを生成します

LLMがデータ型、ネスト構造、命名パターン、専門領域を分析します

ステップ3

8ルール検証

1.型の正しさ
2.$ref ターゲットの有効性
3.専門知識の割り当て
4.専門知識数の上限
5.検索キーの有効性
6.プロパティの命名
7.ネスト構造の深さ
8.必須フィールドの制約

検証に失敗した場合、エラーは自己修正のためにLLMへ返送されます(最大6回まで再試行)

ステップ4

後処理

Null許容の検出、検索キーの降格、expertise domainの収集

出力

検証済みenrichment schema

型付きプロパティ、専門ドメイン、検索キーを備え、エンリッチメントの準備が整っています

ModelRetry による自己修正

LLMはときおり構造的な問題を抱えたスキーマを生成します。スキーマと入力データの型の不一致、存在しない定義を指す $ref、専門領域が多すぎる、といったものです。Entity Enricher は Pydantic-AI の ModelRetry メカニズムを使用してこれらの問題を検出し、同じ生成実行内でLLMにフィードバックして修正させます。

これは透過的に行われます。システムはLLMの出力を8つのルールに照らして検証し、いずれかのルールが失敗した場合、その具体的なエラーが修正の指示とともにモデルに返送されます。この再試行ループは最大6回実行され、手動での介入なしにほぼ100%有効なスキーマ出力を実現します。

適用された検証ルール

型の正しさ

スキーマのプロパティ型は、入力 JSON から観測されたデータ型と一致する必要があります。

$ref 整合性

すべての$refポインターは、$defsセクションで定義されたエンティティを参照する必要があります。

専門知識の割り当て

すべてのプロパティは、有効な専門領域に属している必要があります。

専門知識の数

専門ドメインの合計は、設定可能な上限内に収める必要があります。

検索キーの有効性

検索キーは、空でない値を持つ既存のプロパティを参照する必要があります。

プロパティの命名

プロパティ名はsnake_case規則に従う必要があります。

構造の深さ

ネストの深さは制限内(デフォルト10レベル)に収める必要があります。

フィールド制約

必須フィールド、最小/最大値、および列挙型の制約が検証されます。

インテリジェントな後処理

LLMがスキーマを生成し自己修正した後、追加のデータ駆動型の変換が適用されます:

Null許容の検出

入力データにフィールドのnull値がある場合、そのスキーマプロパティは自動的にnullable(null許容)としてマークされます。これにより、LLMはデータが利用できないフィールドに対して、幻覚的な値を強制する代わりにnullを返すことができます。

検索キーの降格

検索キーとしてマークされていても入力データの値が空のフィールドは、検索キーのフラグが解除されます。これにより、空の検索キーがenrichmentのpromptの焦点を薄めることを防ぎます。

専門知識コレクション

すべての専門領域はネストされたプロパティから最上位のリストに集約されるため、スキーマの領域カバレッジを一目で確認できます。

自然言語で schema を編集

スキーマを生成した後、自然言語の指示を使用して変更できます。「name と ownership_percentage を持つ parent_company 参照を追加」のように入力すると、AIはすべての検証ルールと専門分野の割り当てを維持しながら構造変更を適用します。

AI による各編集では、フィールドの追加、説明の改善、expertise domain の再構成といった5件の改善提案も生成されます。これらの提案はワンクリックで適用できます。

直接操作したい場合は、ビジュアルschemaエディターでドラッグ&ドロップによるプロパティの並べ替え、インラインでのフィールド編集、キーボード操作、完全な取り消し/やり直しがご利用いただけます。詳しくはschemaエディターのドキュメントをご覧ください。

schemaから型安全な出力へ

Entity Enricher は単に JSON スキーマドキュメントを生成するだけではありません。スキーマを実行時に動的な Pydantic モデルへ変換します。このモデルは Pydantic-AI エージェントの構造化出力型として使用されるため、LLM の出力は型レベルでスキーマに対して検証されます。無効な出力は自動的に再試行をトリガーします。

このアプローチは、ユーザー定義スキーマの柔軟性とコンパイル済みモデルの型安全性を兼ね備えています。両方の利点を得られます。任意の形状を定義でき、システムがそれを自動的に強制します。

最初のスキーマを生成する

JSONサンプルを貼り付け、モデルを選択すると、検証済みのエンリッチメントスキーマが数秒で得られます。その後、自然言語またはビジュアルエディターで調整できます。

無料で始める