Tableau de bord des coûts - Documentation Entity Enricher
Tableau de bord des coûts
Analyse des coûts en temps réel avec graphiques temporels, ventilation par modèle, métriques de performance et préréglages de dates configurables.
Vue d'ensemble
Le tableau de bord des coûts vous offre une visibilité complète sur vos dépenses et performances LLM. Il agrège les données de tous les enregistrements d'enrichissement de votre organisation et les présente sous forme de graphiques interactifs et de cartes de synthèse. Utilisez-le pour identifier les tendances de coûts, comparer l'efficacité des modèles et optimiser votre pipeline d'enrichissement.
Onglets
2
Préréglages de dates
4
Types de graphiques
5
Inter-organisations
Propriétaire+
Préréglages de dates
Sélectionnez une plage de temps dans la barre latérale. L'URL se met à jour pour refléter le préréglage sélectionné (p. ex. /costs/30d), permettant des vues enregistrables en favoris :
Préréglage
Période
Regroupement des graphiques
7d
7 derniers jours
Quotidien
30d
30 derniers jours
Quotidien
90d
90 derniers jours
Hebdomadaire
all
Toute la période
Mensuel
Les propriétaires et les administrateurs peuvent activer Toutes les organisations dans la barre latérale pour afficher les coûts agrégés sur l'ensemble de la plateforme. Cette préférence est conservée dans le stockage local.
Onglet Aperçu des coûts
L'onglet par défaut fournit une ventilation complète des dépenses :
Cartes de résumé
Coût total
$12.47
Somme de tous les coûts LLM sur la période
Total des requêtes
342
Nombre d'appels LLM effectués
Coût moyen/requête
$0.036
Coût moyen par appel individuel
Modèle le plus utilisé
claude-sonnet
Modèle avec le plus grand nombre de requêtes
Graphiques et tableaux
Évolution des coûts— Graphique linéaire montrant l'évolution des dépenses sur la période sélectionnée, regroupées par jour/semaine/mois.
Coût par modèle— Graphique à barres horizontales des 10 modèles au coût total le plus élevé. Identifiez rapidement les modèles les plus coûteux.
Utilisation des tokens— Détail des jetons d'entrée, des jetons de sortie et du total des jetons consommés.
Analyses des modèles— Cartes mettant en avant le modèle le plus utilisé et le modèle le plus coûteux.
Répartition quotidienne— Tableau avec la date, le nombre de requêtes, le coût total, le coût moyen par requête et les totaux de tokens.
Onglet Analyse des performances
Passez à l'onglet Performance pour analyser l'efficacité des modèles et identifier les compromis coût-performance :
Cartes de résumé
Total des enregistrements
156
Enregistrements d'enrichissement sur la période
Modèles utilisés
8
Modèles distincts ayant produit des résultats
Variantes linguistiques
3
Langues utilisées dans l'enrichissement multilingue
Plages de tokens
4
Tranches distinctes de taille de tokens d'entrée
Graphiques et tableaux
Coût vs durée— Nuage de points avec des bulles de taille proportionnelle au nombre de requêtes. Chaque bulle représente un modèle — trouvez le meilleur équilibre entre vitesse et coût.
Performances par modèle— Tableau comparant le nombre de requêtes, le coût moyen, la durée moyenne et les statistiques de tokens par modèle.
Coût par nombre de langues— Graphique à barres montrant l'évolution du coût selon le nombre de langues sélectionnées pour l'enrichissement multilingue.
Coût par plage de tokens d'entrée— Graphique à barres détaillant les coûts par tranches de taille de prompt d'entrée (p. ex. 0–1K, 1K–5K, 5K–10K tokens).
Performances par nombre de propriétés du schéma— Tableau montrant la corrélation entre le coût et la durée d'enrichissement et la complexité du schéma (enregistrements d'enrichissement uniquement).
Conseils d'optimisation
Comparer les modèles
Utilisez le nuage de points Coût vs Durée pour trouver des modèles offrant une bonne qualité à moindre coût. Les modèles plus petits et plus rapides suffisent souvent pour les schémas simples.
Surveiller les tendances
Consultez chaque semaine le graphique Coût dans le temps. Des pics soudains peuvent indiquer des tâches de traitement par lot mal configurées ou des boucles de réessai inattendues.
Des schémas bien dimensionnés
Le tableau « Performances par nombre de propriétés du schéma » montre comment le coût évolue avec la taille du schéma. Supprimez les propriétés inutiles pour réduire le coût par enrichissement.
Utiliser les modèles de mise en cache
Les modèles avec mise en cache du prompt (comme Anthropic) réduisent les coûts des enrichissements répétés avec le même schéma. Les cartes d'utilisation des tokens affichent les économies liées aux tokens mis en cache.