Diffbot explore le web et le structure en un immense graphe de connaissances de milliards d'entités, avec des API d'extraction qui transforment les pages en données normalisées. Entity Enricher part d'un principe différent : au lieu d'interroger un graphe préconstruit du web tel qu'il existe, il enrichit les entités que vous définissez selon votre schéma, en s'appuyant sur plusieurs LLM ainsi que sur vos documents et la recherche web en direct — avec arbitrage et identité intégrés.
Vous définissez la structure de sortie — n'importe quels champs, n'importe quelle imbrication, n'importe quel type d'entité — et les modèles la remplissent.
Vous interrogez les types d’entités et les champs fixes du graphe de connaissances de Diffbot. Le format leur appartient.
Vos clés d'entrée sont conservées telles quelles et chaque entité reçoit un ID sémantique stable, propre à votre organisation.
Les entités sont associées à des identifiants de graphes de connaissances globaux, et non modélisées autour de vos propres enregistrements.
Deux LLM ou plus répondent en parallèle ; les conflits sont résolus champ par champ, avec le raisonnement conservé.
Un seul pipeline d'extraction/graphe. Aucune validation croisée entre modèles ni piste d'audit par champ.
Idéal lorsque l'entité et le schéma vous appartiennent, et que la précision et l'identité comptent plus que la couverture web brute.
Idéal lorsque vous avez besoin d'un immense graphe préconstruit ou de structurer des pages web publiques arbitraires à grande échelle.
| Fonctionnalité | Entity Enricher | Diffbot |
|---|---|---|
| Schéma de sortie personnalisé (champs libres) | Types d'entités figés | |
| N'importe quel type d'entité que vous définissez | Types d'entités KG uniquement | |
| Source de vérité | LLM + vos documents + le web | Exploration web + graphe de connaissances |
| Enrichissez vos propres enregistrements / clés | Correspondance avec les entités du graphe de connaissances | |
| Validation croisée multi-modèle | ||
| Arbitrage au niveau du champ + piste d'audit | ||
| ID sémantiques (identité propre à votre tenant) | Identifiants KG globaux | |
| Ingestion de documents (PDF, DOCX, images) | ||
| Extraction de page web / HTML | Via recherche web | |
| Sortie multilingue (40 langues) | ||
| Apportez vos propres clés / modèles auto-hébergés | ||
| Graphe d'entités massif préconstruit | ||
| Interfaces API REST + MCP + n8n / Make | API | |
| Modèle de tarification | Paiement au token (BYOK) | Abonnement / entreprise |
Paiement au token
Apportez vos propres clés API LLM et payez votre fournisseur directement pour les tokens consommés. Aucun abonnement à la plateforme, aucun frais de requête de graphe par appel.
Abonnement
Forfaits mensuels facturés en crédits API / requêtes sur le graphe de connaissances et les API d'extraction, avec des offres entreprise pour le crawling à haut volume et l'accès au graphe de connaissances.
Les tarifs reflètent les grilles publiées publiquement et peuvent changer — consultez chaque fournisseur pour connaître les tarifs en vigueur.
Oubliez le schéma de graphe figé. Définissez votre propre structure, enrichissez n'importe quelle entité à partir de plusieurs modèles, de vos documents et du web, et gardez vos propres clés et votre identité.
Commencer gratuitement