モデルと料金 - Entity Enricher ドキュメント

モデルと料金

LLM プロバイダーとモデルを管理し、外部レジストリからモデルを同期し、ヘルスチェックを実行し、独立した課金のために組織ごとの API キーを設定します。

プロバイダー管理

Entity Enricher は幅広い LLM プロバイダーをサポートしています。各プロバイダーは、それぞれ個別の価格、機能、設定を持つ複数のモデルを持つことができます。

対応provider

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

プロバイダータイプ

標準ほとんどのプロバイダー(Anthropic、OpenAI、Mistralなど)は、ベアラートークン認証を用いた標準的なAPIエンドポイントを使用します。Standardプロバイダーは、カスタムのOpenAI互換エンドポイントを指定することもできます。下記の「Custom & Corporate Endpoints」を参照してください。
AzureAzure OpenAI は、API バージョン設定を伴うカスタムデプロイエンドポイントを使用します。
OllamaカスタムエンドポイントURLと自動モデル検出に対応した、セルフホストの Ollama インスタンス。

カスタム&企業向けエンドポイント

多くのチームは、LLMトラフィックを企業向けAIゲートウェイ、リージョナルエンドポイント、または組み込みではないプロバイダー(例: エンタープライズのLiteLLMプロキシ、Cloudflare AI Gateway、Alibaba DashScope(Qwenモデル用))経由でルーティングします。これらは、カスタムベースURLを持つ独自のStandard(OpenAI互換)プロバイダーとして追加します。

ゲートウェイプロバイダーの追加

  1. 組み込み名以外の名前でproviderを作成してください(例: acme-openai-gw)。openai anthropicのような組み込み名は予約されています。
  2. 標準(OpenAI互換)タイプを選択し、カスタムAPIエンドポイント(ベースURL)を入力してください。例: https://gateway.example.com/v1。このフィールドは、Entity Enricher に組み込みクライアントがないproviderの場合は必須です。
  3. そのプロバイダーの組織キーとしてゲートウェイのキーを追加すると(API Keys → AI Provider Keys)、組織単位で課金とローテーションが行われます。
  4. ゲートウェイが提供するモデルを追加します。モデル識別子はそのまま送信されるため、ゲートウェイが想定するものと完全に一致する必要があります。

知っておくと便利な情報

  • 組み込みのproviderではエンドポイントフィールドが非表示になります。 Anthropic、OpenAI、Mistral、その他の認識されているproviderは既にエンドポイントを把握しているため、設定する必要はありません。カスタムproviderが後から組み込みになった場合でも、保存済みのエンドポイントは表示されたままとなり、クリアできます。
  • パブリック HTTPS のみ。 エンドポイントはパブリックな https:// URL である必要があります。SSRF を防ぐため、ループバックおよびプライベートレンジ(localhost 10.x 192.168.x)は拒否されます。セルフホストのサーバーはインターネット経由で到達可能でなければなりません。ローカルの Ollama の場合は、専用の Ollama トンネルを使用してください。
  • OpenAI互換のワイヤーフォーマット。 カスタムプロバイダーへの呼び出しは OpenAI 互換 API を経由してルーティングされるため、エンドポイントは OpenAI の /v1 プロトコル(チャット補完、/models)に対応している必要があります。
  • 接続テスト {endpoint}/modelsにプローブを送り、enrichmentを実行する前にキーとベースURLを検証します。

同時実行数の上限(キーごと)

各 provider には キーごとの最大同時呼び出し数設定(レート制限のオーバーライド)があります。これは、単一の API キーが並列で実行する LLM 呼び出し数を上限として制限し、そのキーを使用するすべてのフロー、つまり複数 expertise domain の enrichment ファンアウト、classification、arbitration、schema/サンプル生成をカバーします。

  • プロバイダーごとではなく、キーごとに制限されます。 すべての組織キーと共有のグローバルキーには、それぞれ独立した予算が割り当てられるため、あるキーの並列呼び出しが別のキーの呼び出しを圧迫することはありません。
  • 未設定の場合は妥当なデフォルトにフォールバックします(providerごとのデフォルト。通常は3~5の並列呼び出し)。
  • 次のジョブから有効になります — 再起動は不要です。

これは、プランの最大同時実行ジョブ数の制限とは別のものです。この制限は、組織全体がすべてのプロバイダーにわたって一度に実行するエンリッチメントジョブの数を制限します。

モデルの機能

各モデルはその機能を追跡し、モデルセレクターにアイコンとして表示します:

機能説明
ビジョン画像および視覚的な入力を処理できます
ツール呼び出し関数呼び出し / ツール利用に対応
音声入力音声入力を処理できます
PDF 入力PDF文書を処理できます
promptキャッシュコスト削減のためのpromptキャッシュに対応
推論拡張思考/思考連鎖(chain-of-thought)の機能

料金の自動同期

外部レジストリと同期して、モデルの料金を最新の状態に保ちます。同期処理では、新しいモデル、価格変更、削除されたモデルを自動的に検出します。

LiteLLM レジストリ

デフォルトの価格ソースです。実際のAPIモデル名、価格、コンテキスト長、機能を含む、LiteLLMのコミュニティが管理するレジストリをGitHubから取得します。

約30のproviderに対応。表示名、benchmark、生成速度は含まれません。

PricePerToken

pricepertoken.com からの代替ソースです。表示名、ベンチマーク(コーディングおよび数学のスコア)、生成速度(1秒あたりのトークン数)が含まれます。

約20のproviderに対応。LiteLLMより豊富なメタデータを提供します。

同期プロセス

  1. ドライランプレビュー — 適用前に何が変更されるかを確認できます。新しいmodel、価格の更新、無効化を表示します。
  2. ソース単位のマッチング — 各ソースはそのソース由来のmodelのみに影響します。手動のmodelは決して変更されません。
  3. 安定した同期キー — modelは名前ではなく安定した識別子でマッチングされます。同期を壊すことなくmodelの名前を変更できます。
  4. トランザクションによる適用 — 整合性のため、すべての変更は単一のデータベーストランザクションで適用されます。
  5. プロバイダーの自動作成 — 同期されたモデルが未知のプロバイダーに属している場合、そのプロバイダーは自動的に作成されます。

モデルのヘルスチェック

最小限のヘルスチェックプロンプトを実行して、モデルに到達可能かどうかを事前に検証します。これにより、エンリッチメント中にユーザーがエラーに遭遇する前に、故障したモデルを検出できます。

合格モデルが正常に応答します。以前に自動で無効化されていた場合は、再度有効化されます。
見つかりませんモデルが「見つかりません」エラーを返します。今後の失敗を防ぐため、自動的に無効化されます。
その他のエラー認証エラー、タイムアウト、レート制限は報告されますが、無効化のトリガーにはなりません。

ヘルスチェックは、すべてのモデル、特定のプロバイダーのモデル、または単一のモデルに対して実行できます。結果は SSE を介してリアルタイムでストリーミングされ、成功/失敗の件数を示すプログレスバーが表示されます。

自動無効化

enrichment呼び出しが「model not found」エラーで失敗すると、繰り返しの失敗を防ぐためにそのmodelは自動的に無効化されます。これは通常のenrichment処理中にリアルタイムで発生します。

無効化の理由設定者自動再有効化されましたか?
モデルが見つかりませんエンリッチメントエラーまたはヘルスチェックはい(価格同期または検証による)
同期で削除済み料金の同期(モデルが消失しました)はい(モデルがレジストリに再表示された場合)
手動UIの管理者トグルいいえ(手動での再有効化のみ)

独自のキーを持ち込む (BYOK)

組織は独自の LLM provider API キーを設定して、請求と使用状況の追跡を個別に行えます。システムは LRU 選択による 2 層のキー解決を使用します:

1位
組織キープール

API Keys ページで設定される organization ごとのキー。provider ごとに複数のキーを持ち、LRU ローテーションに対応します。Fernet で暗号化されます。

2位
グローバルキープール

管理者が管理するシステム全体のキーです。すべての organization で共有されます。LRU ローテーションによる provider ごとの複数キーにも対応します。

各 enrichment ではどのキーが使用されたかが記録されるため、キーごとにコストを追跡できます。キーにはヘルスチェック対応や使用回数カウンターが含まれ、恒久的な障害(無効なキー、支払いが必要)の場合は自動的に無効化されます。レート制限を受けたキーは一時的にバックオフされ、その間はプール内の他のキーが使用されます。キーの管理方法については API Keys ガイドをご覧ください。

インポートとエクスポート

プロバイダーとモデルの設定全体をJSONとしてエクスポートし、バックアップや別インスタンスへの移行に利用できます。インポートは常にアップサートです。既存のプロバイダーとモデルは名前で照合されてその場で更新され、新規のものは追加されます — 削除されるものはありません。

エクスポートにはプロバイダー設定、モデル構成、価格、機能、および正規モデル仕様が含まれますが、API キーは含まれません。API キーは別途保存されます。インポート後は API キーを別途設定してください。システム管理者はグローバルカタログ全体をバックアップします。組織のオーナーは自組織のプロバイダーとモデルのみをエクスポートおよびインポートでき、共有のグローバルカタログはインポートを通じて作成または編集することはできません。

次のステップ