Modèles et tarifs - Documentation Entity Enricher

Modèles et tarifs

Gérez les fournisseurs et modèles LLM, synchronisez les modèles depuis des registres externes, exécutez des contrôles de santé et configurez des clés API par organisation pour une facturation indépendante.

Gestion des fournisseurs

Entity Enricher prend en charge un large éventail de fournisseurs LLM. Chaque fournisseur peut proposer plusieurs modèles avec une tarification, des capacités et une configuration individuelles.

Fournisseurs pris en charge

AnthropicOpenAIGoogleMistralDeepSeekGroqTogether AIFireworks AICoherexAINVIDIA NIMOllamaAzure OpenAI

Types de fournisseurs

StandardLa plupart des fournisseurs (Anthropic, OpenAI, Mistral, etc.) utilisent des points de terminaison API standard avec une authentification par jeton bearer. Un fournisseur Standard peut aussi pointer vers un point de terminaison personnalisé compatible OpenAI — voir Points de terminaison personnalisés et d'entreprise ci-dessous.
AzureAzure OpenAI utilise des points de terminaison de déploiement personnalisés avec configuration de la version d'API.
OllamaInstances Ollama auto-hébergées avec URL de point de terminaison personnalisées et découverte automatique des modèles.

Points de terminaison personnalisés et d'entreprise

De nombreuses équipes font transiter leur trafic LLM par une passerelle IA d'entreprise, un point de terminaison régional ou un fournisseur non intégré — par exemple un proxy LiteLLM d'entreprise, Cloudflare AI Gateway ou Alibaba DashScope (pour les modèles Qwen). Vous les ajoutez en tant que fournisseur Standard (compatible OpenAI) distinct avec une URL de base personnalisée.

Ajouter un fournisseur passerelle

  1. Créez un fournisseur avec un nom qui ne fait pas partie des noms intégrés (ex. acme-openai-gw). Les noms intégrés comme openai ou anthropic sont réservés.
  2. Choisissez le type Standard (compatible OpenAI) et renseignez Point de terminaison API personnalisé (URL de base) — p. ex. https://gateway.example.com/v1. Ce champ est obligatoire pour tout fournisseur pour lequel Entity Enricher ne dispose pas de client intégré.
  3. Ajoutez la clé de la passerelle comme clé d'organisation pour ce fournisseur (Clés API → Clés de fournisseurs IA), afin que la facturation et la rotation se fassent par organisation.
  4. Ajoutez les modèles servis par la passerelle. L'identifiant du modèle est envoyé tel quel, il doit donc correspondre exactement à ce que la passerelle attend.

Bon à savoir

  • Les fournisseurs intégrés masquent le champ endpoint. Anthropic, OpenAI, Mistral et les autres fournisseurs reconnus connaissent déjà leur endpoint, il n'y a donc rien à configurer. Si un fournisseur personnalisé devient plus tard intégré, son endpoint enregistré reste visible afin que vous puissiez l'effacer.
  • HTTPS public uniquement. Les points de terminaison doivent être des URL publiques https://. Les adresses de bouclage et les plages privées (localhost, 10.x, 192.168.x) sont rejetées pour prévenir les attaques SSRF — un serveur auto-hébergé doit être accessible depuis Internet. Pour un Ollama local, utilisez plutôt le tunnel Ollama dédié.
  • Format compatible OpenAI. Les appels à un fournisseur personnalisé passent par l'API compatible OpenAI : le point de terminaison doit donc prendre en charge le protocole OpenAI /v1 (chat completions, /models).
  • Tester la connexion interroge {endpoint}/models pour vérifier la clé et l'URL de base avant de lancer un enrichissement.

Limites de concurrence (par clé)

Chaque fournisseur dispose d'un paramètre Nombre maximal d'appels simultanés par clé (sa limite de débit personnalisée). Il plafonne le nombre d'appels LLM qu'une même clé API exécute en parallèle — couvrant tous les flux qui utilisent la clé : la répartition d'enrichissement multi-expertise, la classification, l'arbitrage et la génération de schémas / d'exemples.

  • Limité par clé, et non par fournisseur. Chaque clé d'organisation et la clé globale partagée disposent chacune de leur propre budget indépendant, de sorte que les appels parallèles d'une clé n'évincent jamais ceux d'une autre.
  • Revient à une valeur par défaut raisonnable si non défini (valeurs par défaut par fournisseur, généralement 3 à 5 appels simultanés).
  • Prend effet à la prochaine tâche — aucun redémarrage nécessaire.

Ceci est distinct de la limite de tâches simultanées maximum de votre forfait, qui plafonne le nombre de tâches d'enrichissement exécutées à la fois par l'ensemble de votre organisation, tous fournisseurs confondus.

Capacités du modèle

Chaque modèle suit ses capacités, affichées sous forme d'icônes dans le sélecteur de modèles :

CapacitéDescription
VisionPeut traiter des images et des entrées visuelles
Appels d'outilsPrend en charge l'appel de fonctions / l'utilisation d'outils
Entrée audioPeut traiter des entrées audio
Entrée PDFPeut traiter des documents PDF
Mise en cache des promptsPrend en charge la mise en cache des prompts pour réduire les coûts
RaisonnementCapacités de réflexion étendue / chaîne de pensée

Synchronisation automatique des tarifs

Maintenez les tarifs des modèles à jour en les synchronisant depuis des registres externes. Le processus de synchronisation détecte automatiquement les nouveaux modèles, les changements de prix et les modèles supprimés.

Registre LiteLLM

La source de tarification par défaut. Récupère les données depuis le registre communautaire de LiteLLM sur GitHub, avec les vrais noms de modèles API, les tarifs, les longueurs de contexte et les capacités.

Couvre ~30 fournisseurs. N'inclut pas les noms d'affichage, les benchmarks ni la vitesse de génération.

PricePerToken

Une source alternative provenant de pricepertoken.com. Inclut les noms d'affichage, les benchmarks (scores en programmation et en mathématiques) et la vitesse de génération (tokens par seconde).

Couvre ~20 fournisseurs. Fournit des métadonnées plus riches que LiteLLM.

Processus de synchronisation

  1. Aperçu en mode simulation — Voyez ce qui changera avant d'appliquer. Consultez les nouveaux modèles, les mises à jour de prix et les désactivations.
  2. Correspondance limitée à la source — Chaque source n'affecte que les modèles qui en proviennent. Les modèles manuels ne sont jamais modifiés.
  3. Clés de synchronisation stables — Les modèles sont mis en correspondance par un identifiant stable, pas par leur nom. Vous pouvez renommer les modèles sans casser la synchronisation.
  4. Application transactionnelle — Toutes les modifications sont appliquées dans une seule transaction de base de données pour garantir la cohérence.
  5. Création automatique de fournisseur — Si un modèle synchronisé appartient à un fournisseur inconnu, celui-ci est créé automatiquement.

Contrôles de santé des modèles

Validez proactivement l'accessibilité des modèles en exécutant un prompt minimal de vérification d'état. Cela permet de détecter les modèles défaillants avant que les utilisateurs ne rencontrent des erreurs lors de l'enrichissement.

RéussiteLe modèle répond correctement. S'il avait été désactivé automatiquement, il est réactivé.
IntrouvableLe modèle renvoie une erreur « introuvable ». Il est automatiquement désactivé pour éviter de futurs échecs.
Autre erreurLes erreurs d'authentification, délais d'expiration ou limites de débit sont signalés mais ne déclenchent pas de désactivation.

Les vérifications d'état peuvent être exécutées sur tous les modèles, sur les modèles d'un fournisseur spécifique ou sur un seul modèle. Les résultats sont diffusés en temps réel via SSE, avec une barre de progression affichant le nombre de réussites et d'échecs.

Désactivation automatique

Lorsqu'un appel d'enrichissement échoue avec une erreur « modèle introuvable », le modèle est automatiquement désactivé pour éviter des échecs répétés. Cela se produit en temps réel pendant les opérations d'enrichissement normales.

Motif de désactivationDéfini parRéactivé automatiquement ?
Modèle introuvableErreurs d'enrichissement ou vérifications d'étatOui (par synchronisation des tarifs ou validation)
Supprimés à la synchronisationSynchronisation des tarifs (modèle disparu)Oui (si le modèle réapparaît dans le registre)
ManuelBascule administrateur dans l'interfaceNon (réactivation manuelle uniquement)

Apportez votre propre clé (BYOK)

Les organisations peuvent configurer leurs propres clés API de fournisseur LLM pour une facturation et un suivi d'utilisation indépendants. Le système utilise une résolution de clés à deux niveaux avec sélection LRU :

1er
Pool de clés de l'organisation

Clés par organisation configurées dans la page Clés API. Prend en charge plusieurs clés par fournisseur avec rotation LRU. Chiffrées avec Fernet.

2e
Pool de clés globales

Clés à l'échelle du système gérées par les administrateurs. Partagées entre toutes les organisations. Prend également en charge plusieurs clés par fournisseur avec rotation LRU.

Chaque enrichissement enregistre la clé utilisée, ce qui vous permet de suivre les coûts par clé. Les clés bénéficient d'une vérification d'état et de compteurs d'utilisation, et sont automatiquement désactivées en cas d'échec permanent (clé invalide, paiement requis). Les clés soumises à une limite de débit sont temporairement mises en attente pendant que les autres clés du pool sont utilisées. Découvrez comment gérer les clés dans le guide Clés API.

Import & Export

Exportez l'ensemble de votre configuration de fournisseurs et de modèles au format JSON pour une sauvegarde ou un transfert vers une autre instance. L'import est toujours un upsert : les fournisseurs et modèles existants sont identifiés par leur nom et mis à jour sur place, tandis que les nouveaux sont ajoutés — rien n'est supprimé.

L'export inclut les paramètres des fournisseurs, les configurations de modèles, la tarification, les capacités et les spécifications canoniques des modèles — mais jamais les clés API, qui sont stockées séparément. Après l'import, configurez les clés API séparément. Les administrateurs système sauvegardent l'intégralité du catalogue global ; les propriétaires d'organisation exportent et importent uniquement les fournisseurs et modèles de leur propre organisation — le catalogue global partagé ne peut être ni créé ni modifié via l'import.

Prochaines étapes