Une présentation pas à pas du traitement d'une entité par Entity Enricher — de l'entrée à la sortie structurée, en passant par la classification et l'exécution parallèle des modèles.
Ouvrez la page Éditeur de schéma et configurez votre enrichissement. Un assistant par étapes vous guide à travers les phases du pipeline : Données d'exemple, Schéma, Enrichissement et Résultats.
Collez un exemple JSON pour générer automatiquement un schéma, puis explorez l'arborescence interactive des propriétés. Modifiez les propriétés, ajoutez des domaines d'expertise et marquez les champs comme clés de recherche ou préservés.
Configurez les options d'enrichissement (stratégie, modèles, langues, classification, ainsi que le schéma de réponse et les options de sortie structurée stricte) et renseignez les clés de recherche de l'entité (nom, site web, pays, etc.) pour identifier l'entité.
Affiche la progression et les résultats en temps réel pour chaque modèle. Lors de l'utilisation de plusieurs modèles, un bouton « Fusionner les résultats » apparaît pour la fusion.
Si vous avez sélectionné un modèle de classification, un appel LLM rapide et peu coûteux s'exécute d'abord pour vérifier que l'entité correspond au type du schéma. Cela évite de gaspiller des tokens en enrichissement lorsque l'entité ne correspond pas. En savoir plus dans la documentation sur la classification.
Chaque modèle sélectionné traite l'entité selon la stratégie que vous avez choisie. Lorsque plusieurs modèles sont sélectionnés, ils s'exécutent en parallèle entre les fournisseurs (Claude et GPT-4 s'exécutent simultanément), tandis que les modèles d'un même fournisseur s'exécutent séquentiellement pour respecter les limites de débit.
Chaque réponse du LLM est validée en temps réel par rapport à votre schéma. Lorsque la sortie ne correspond pas aux types ou contraintes attendus, le système renvoie automatiquement les erreurs au LLM pour correction.
Jusqu'à 5 nouvelles tentatives automatiques par appel LLM. Chaque nouvelle tentative inclut l'erreur de validation spécifique afin que le LLM sache exactement quoi corriger.
Deux options facultatives demandent au provider de contraindre la sortie avant qu'elle ne soit renvoyée, afin de réduire le nombre de réponses à corriger. Les deux ne s'appliquent qu'aux modèles qui les prennent en charge ; tout le reste repose sur la boucle de validation et de nouvelle tentative décrite ci-dessus.
Entity Enricher utilise les Server-Sent Events (SSE) pour diffuser la progression en temps réel. Vous n'avez pas à attendre que tous les modèles aient terminé — les résultats apparaissent progressivement à mesure que chaque domaine d'expertise ou modèle se termine.
Chaque modèle dispose de son propre panneau de résultats affichant la sortie JSON structurée, les badges de progression par expertise, l'utilisation de tokens, le coût et le temps de traitement. Avec la stratégie multi-expertise, les badges d'expertise se mettent à jour en temps réel à mesure que chaque domaine se termine.
Avec la stratégie multi-expertise, certaines expertises peuvent échouer tandis que d'autres réussissent. Plutôt que de tout rejeter, Entity Enricher renvoie la sortie fusionnée des expertises réussies avec le statut « Partiel ». Vous pouvez ensuite relancer uniquement les expertises en échec sans réexécuter tout l'enrichissement.
Une fois l'enrichissement terminé, vos résultats sont enregistrés sur la page Enregistrements pour référence ultérieure. Si vous avez utilisé plusieurs modèles, vous pouvez fusionner les résultats avec la Fusion multi-modèles.