Stratégies d'enrichissement - Documentation Entity Enricher

Stratégies d'enrichissement

Entity Enricher propose deux stratégies d'enrichissement qui contrôlent l'orchestration des appels LLM. Le choix de la bonne stratégie influe sur la précision, la vitesse et le coût.

Diagrammes de pipeline

De la configuration la plus simple à la plus puissante. Chacune s'appuie sur la précédente.

Simple

Passe unique — 1 modèle

Un modèle, un appel. L'intégralité du schéma est envoyée dans un seul prompt. Rapide et économique — idéal pour les schémas simples ou l'itération rapide.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Anthropic

Utilisez n'importe quel fournisseur LLM avec votre propre clé API.

AnthropicSchéma complet

Schéma complet en un seul appel — nouvelles tentatives automatiques en cas d'échec de validation.

Résultat enrichi

Aspirin

Multi-modèle

Passe unique — 3 modèles

Même stratégie, mais exécutée sur plusieurs modèles en parallèle. Les résultats sont comparés et arbitrés champ par champ pour produire un résultat unique à haute confiance.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Classification préalable

Correspondance — Pharmaceutical Compound

Détecte les incompatibilités de type avant de gaspiller des crédits LLM.

Anthropic

OpenAI

Google Gemini

Apportez vos propres clés API — compatible avec tous les fournisseurs LLM.

AnthropicSchéma complet

OpenAISchéma complet

GeminiSchéma complet

Schéma complet en un seul appel — nouvelles tentatives automatiques en cas d'échec de validation.

Résultat enrichi final

Aspirin

Arbitré

Une résolution raisonnée des conflits au niveau des champs produit le résultat final fiable.

Avancé

Multi-expertise — 3 modèles

Le schéma est découpé par domaine d'expertise. Chaque modèle reçoit des sous-prompts ciblés pour chaque domaine. Les résultats sont fusionnés en profondeur par modèle, puis arbitrés entre les modèles. Précision maximale pour les schémas complexes multi-domaines.

Entité

Aspirin

Toute entité : entreprise, médicament, affaire juridique, article de recherche...

Classification préalable

Correspondance — Pharmaceutical Compound

Détecte les incompatibilités de type avant de gaspiller des crédits LLM.

Anthropic

OpenAI

Google Gemini

Apportez vos propres clés API — compatible avec tous les fournisseurs LLM.

Anthropic

PharmacologiePrompt LLM

RéglementairePrompt LLM

OpenAI

PharmacologiePrompt LLM

RéglementairePrompt LLM

Gemini

PharmacologiePrompt LLM

RéglementairePrompt LLM

Schéma découpé par domaine — les prompts auto-correcteurs réessaient en cas d'échec de validation.

Anthropic Résultat

OpenAI Résultat

Gemini Résultat

Fusion profonde des réponses d'expertise par modèle.

Résultat enrichi final

Aspirin

Arbitré

Une résolution raisonnée des conflits au niveau des champs produit le résultat final fiable.

Comparaison détaillée

Aspect	Passe unique	Multi-expertise
Appels LLM	1 par modèle	N par modèle (1 par domaine d'expertise)
Schéma envoyé	Schéma complet en un seul prompt	Sous-ensemble par domaine d'expertise
Exécution	Séquentiel (un seul appel)	Parallèle (toutes les expertises s'exécutent simultanément)
Exactitude	Adapté aux schémas simples	Plus élevé — des prompts ciblés donnent de meilleurs résultats
Vitesse	Plus rapide pour les petits schémas	L'exécution parallèle peut être plus rapide pour les grands schémas
Coût	Plus faible (surcoût d'un seul appel)	Plus élevé (appels multiples avec surcoût par appel)
Streaming	Résultat tout ou rien	Progressif — les résultats arrivent en continu à mesure que chaque expertise se termine
Succès partiel	Non — l'appel entier réussit ou échoue	Oui — les expertises réussies sont conservées, les expertises en échec peuvent être relancées

Quand utiliser chaque stratégie

Utilisez la passe unique lorsque :

•Votre schéma comporte moins de 15 à 20 propriétés
•Toutes les propriétés appartiennent à un seul domaine (par ex. toutes les données financières)
•Vous voulez le résultat le plus rapide et le moins cher, et la précision est moins critique
•Vous testez un nouveau schéma et itérez rapidement

Utilisez la multi-expertise lorsque :

•Votre schéma couvre plusieurs domaines d'expertise (pharmaceutique, financier, géographique, etc.)
•Vous avez un schéma complexe comportant plus de 20 propriétés
•L'exactitude est essentielle et vous souhaitez des prompts ciblés et spécialisés
•Vous voulez suivre la progression en temps réel à mesure que chaque domaine se termine
•Vous avez besoin d'une gestion des succès partiels — relancer uniquement ce qui a échoué

Fonctionnement détaillé de la multi-expertise

La stratégie multi-expertise suit un processus en quatre étapes pour chaque modèle :

Regrouper les propriétés par expertise

Le schéma est parcouru récursivement. Chaque propriété portant une étiquette de domaine d'expertise est regroupée avec celles partageant le même domaine. Par exemple, revenue et market_cap vont dans le groupe « financial », tandis que gmp_status va dans « regulatory ».

Créer des sous-schémas ciblés

Chaque groupe d'expertise devient un sous-schéma minimal contenant uniquement ses propriétés. Le LLM reçoit ainsi un prompt plus petit et plus ciblé, et n'a qu'à renseigner les champs de sa spécialité.

Exécuter en parallèle

Tous les appels d'expertise s'exécutent en parallèle. Un schéma comportant 5 domaines d'expertise lancera 5 appels LLM simultanément. À mesure que chacun se termine, ses résultats sont fusionnés en profondeur dans la sortie accumulée et diffusés en temps réel dans l'interface.

Gérer les échecs partiels

Si certaines expertises échouent, le système renvoie la sortie fusionnée des expertises réussies avec un statut « Partiel ». Vous pouvez relancer uniquement les expertises en échec, et les nouveaux résultats seront fusionnés dans la sortie existante sans répéter le travail déjà réussi.

Combinaison avec l'enrichissement multi-modèle

Les deux stratégies peuvent être combinées avec l'enrichissement multi-modèle. Lorsque vous sélectionnez plusieurs modèles, chaque modèle exécute la stratégie choisie indépendamment. Les résultats peuvent ensuite être fusionnés via la fusion multi-modèle pour produire une sortie unique à haute confiance.

Exemple : utiliser la multi-expertise avec 3 modèles et un schéma comportant 4 domaines d'expertise lancera 12 appels LLM au total (3 modèles x 4 expertises). Les modèles de fournisseurs différents s'exécutent en parallèle, tandis que les modèles d'un même fournisseur sont mis en file d'attente pour respecter les limites de débit.

Flux d'enrichissement

Présentation complète du pipeline

Classification

Vérification préalable du type d'entité

Fusion multi-modèle

Fusionner les résultats de plusieurs modèles

Stratégies d'enrichissement

Diagrammes de pipeline

Passe unique — 1 modèle

Passe unique — 3 modèles

Multi-expertise — 3 modèles

Comparaison détaillée

Quand utiliser chaque stratégie

Utilisez la passe unique lorsque :

Utilisez la multi-expertise lorsque :

Fonctionnement détaillé de la multi-expertise

Combinaison avec l'enrichissement multi-modèle

Documentation associée