Stratégies d'enrichissement - Documentation Entity Enricher

Stratégies d'enrichissement

Entity Enricher propose deux stratégies d'enrichissement qui contrôlent l'orchestration des appels LLM. Le choix de la bonne stratégie influe sur la précision, la vitesse et le coût.

Diagrammes de pipeline

De la configuration la plus simple à la plus puissante. Chacune s'appuie sur la précédente.

Simple

Passe unique — 1 modèle

Un modèle, un appel. L'intégralité du schéma est envoyée dans un seul prompt. Rapide et économique — idéal pour les schémas simples ou l'itération rapide.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Anthropic

Utilisez n'importe quel fournisseur LLM avec votre propre clé API.

AnthropicSchéma complet

Schéma complet en un seul appel — nouvelles tentatives automatiques en cas d'échec de validation.

Résultat enrichi

Aspirin

Multi-modèle

Passe unique — 3 modèles

Même stratégie, mais exécutée sur plusieurs modèles en parallèle. Les résultats sont comparés et arbitrés champ par champ pour produire un résultat unique à haute confiance.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Classification préalable

Correspondance — Pharmaceutical Compound

Détecte les incompatibilités de type avant de gaspiller des crédits LLM.

Anthropic
OpenAI
Google Gemini

Apportez vos propres clés API — compatible avec tous les fournisseurs LLM.

AnthropicSchéma complet
OpenAISchéma complet
GeminiSchéma complet

Schéma complet en un seul appel — nouvelles tentatives automatiques en cas d'échec de validation.

Résultat enrichi final

Aspirin

Arbitré

Une résolution raisonnée des conflits au niveau des champs produit le résultat final fiable.

Avancé

Multi-expertise — 3 modèles

Le schéma est découpé par domaine d'expertise. Chaque modèle reçoit des sous-prompts ciblés pour chaque domaine. Les résultats sont fusionnés en profondeur par modèle, puis arbitrés entre les modèles. Précision maximale pour les schémas complexes multi-domaines.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Classification préalable

Correspondance — Pharmaceutical Compound

Détecte les incompatibilités de type avant de gaspiller des crédits LLM.

Anthropic
OpenAI
Google Gemini

Apportez vos propres clés API — compatible avec tous les fournisseurs LLM.

Anthropic
PharmacologiePrompt LLM
RéglementairePrompt LLM
OpenAI
PharmacologiePrompt LLM
RéglementairePrompt LLM
Gemini
PharmacologiePrompt LLM
RéglementairePrompt LLM

Schéma découpé par domaine — les prompts auto-correcteurs réessaient en cas d'échec de validation.

Anthropic Résultat
OpenAI Résultat
Gemini Résultat

Fusion profonde des réponses d'expertise par modèle.

Résultat enrichi final

Aspirin

Arbitré

Une résolution raisonnée des conflits au niveau des champs produit le résultat final fiable.

Comparaison détaillée

AspectPasse uniqueMulti-expertise
Appels LLM1 par modèleN par modèle (1 par domaine d'expertise)
Schéma envoyéSchéma complet en un seul promptSous-ensemble par domaine d'expertise
ExécutionSéquentiel (un seul appel)Parallèle (toutes les expertises s'exécutent simultanément)
ExactitudeAdapté aux schémas simplesPlus élevé — des prompts ciblés donnent de meilleurs résultats
VitessePlus rapide pour les petits schémasL'exécution parallèle peut être plus rapide pour les grands schémas
CoûtPlus faible (surcoût d'un seul appel)Plus élevé (appels multiples avec surcoût par appel)
StreamingRésultat tout ou rienProgressif — les résultats arrivent en continu à mesure que chaque expertise se termine
Succès partielNon — l'appel entier réussit ou échoueOui — les expertises réussies sont conservées, les expertises en échec peuvent être relancées

Quand utiliser chaque stratégie

Utilisez la passe unique lorsque :

  • Votre schéma comporte moins de 15 à 20 propriétés
  • Toutes les propriétés appartiennent à un seul domaine (par ex. toutes les données financières)
  • Vous voulez le résultat le plus rapide et le moins cher, et la précision est moins critique
  • Vous testez un nouveau schéma et itérez rapidement

Utilisez la multi-expertise lorsque :

  • Votre schéma couvre plusieurs domaines d'expertise (pharmaceutique, financier, géographique, etc.)
  • Vous avez un schéma complexe comportant plus de 20 propriétés
  • L'exactitude est essentielle et vous souhaitez des prompts ciblés et spécialisés
  • Vous voulez suivre la progression en temps réel à mesure que chaque domaine se termine
  • Vous avez besoin d'une gestion des succès partiels — relancer uniquement ce qui a échoué

Fonctionnement détaillé de la multi-expertise

La stratégie multi-expertise suit un processus en quatre étapes pour chaque modèle :

1
Regrouper les propriétés par expertise

Le schéma est parcouru récursivement. Chaque propriété portant une étiquette de domaine d'expertise est regroupée avec celles partageant le même domaine. Par exemple, revenue et market_cap vont dans le groupe « financial », tandis que gmp_status va dans « regulatory ».

2
Créer des sous-schémas ciblés

Chaque groupe d'expertise devient un sous-schéma minimal contenant uniquement ses propriétés. Le LLM reçoit ainsi un prompt plus petit et plus ciblé, et n'a qu'à renseigner les champs de sa spécialité.

3
Exécuter en parallèle

Tous les appels d'expertise s'exécutent en parallèle. Un schéma comportant 5 domaines d'expertise lancera 5 appels LLM simultanément. À mesure que chacun se termine, ses résultats sont fusionnés en profondeur dans la sortie accumulée et diffusés en temps réel dans l'interface.

4
Gérer les échecs partiels

Si certaines expertises échouent, le système renvoie la sortie fusionnée des expertises réussies avec un statut « Partiel ». Vous pouvez relancer uniquement les expertises en échec, et les nouveaux résultats seront fusionnés dans la sortie existante sans répéter le travail déjà réussi.

Combinaison avec l'enrichissement multi-modèle

Les deux stratégies peuvent être combinées avec l'enrichissement multi-modèle. Lorsque vous sélectionnez plusieurs modèles, chaque modèle exécute la stratégie choisie indépendamment. Les résultats peuvent ensuite être fusionnés via la fusion multi-modèle pour produire une sortie unique à haute confiance.

Exemple : utiliser la multi-expertise avec 3 modèles et un schéma comportant 4 domaines d'expertise lancera 12 appels LLM au total (3 modèles x 4 expertises). Les modèles de fournisseurs différents s'exécutent en parallèle, tandis que les modèles d'un même fournisseur sont mis en file d'attente pour respecter les limites de débit.